
基于矩阵的Apriori算法改进研究
下载需积分: 47 | 253KB |
更新于2024-09-09
| 88 浏览量 | 举报
收藏
数据挖掘关联规则Apriori算法的一种新改进
Apriori算法是数据挖掘关联规则算法的核心,但随着对关联规则研究的深入,它的缺点也暴露出来了。Apriori算法有两个致命的性能瓶颈:多次扫描事务数据库,需要很大的I/O负载;产生庞大的候选集。因此,Apriori算法仍有需要改进的地方。本文提出了一种新的基于矩阵的改进Apriori算法,充分利用了内存空间,大大减少扫描数据库的次数,多次试验的结果表明该方法有效提高了大型数据库的使用效率。
知识点:
1. 数据挖掘(Data Mining):从大量数据中提取或“挖掘”知识,它能高度自动化地分析原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测出对象的行为。
2. 关联规则挖掘:从数据库中得出数据相关性的代名词。关联规则挖掘主要集中在三个方面:基于项的关联规则挖掘、定量的关联规则挖掘、因果规则。
3. Apriori算法:数据挖掘关联规则算法的核心,但Apriori算法有两个致命的性能瓶颈:多次扫描事务数据库,需要很大的I/O负载;产生庞大的候选集。
4. 改进Apriori算法:提出了一种新的基于矩阵的改进Apriori算法,充分利用了内存空间,大大减少扫描数据库的次数,多次试验的结果表明该方法有效提高了大型数据库的使用效率。
5. 数据挖掘定义:从广义的观点,数据挖掘是从大型数据集(可能是不完全的、有噪声的、不确定性的、各种存储形式的)中,挖掘隐含在其中的、人们事先不知道的、对决策有用的知识的过程。从狭义的观点,数据挖掘是从特定形式的数据集中提炼知识的过程。
6. 关联规则:关联规则是形如:A→B的蕴涵式,其中A⊆I,I⊆B,且A∩B=∅。关联规则可以被用来挖掘关联模式,进行异常检测。
7. 项集:设I={i1,i2,…,im}是项的集合,D={t1,t2,…,tm}(其中ti={i1,i2,…,ik}∈I)是数据库事务的集合,每一个事务有惟一标识符,称作TID。
8. 聚类算法:可以被用来构建正常行为模式,进行异常检测。
9. 分类算法:可以用来构造分类器,分类器经过大量的入侵数据集训练之后可以用于入侵检测。
10. 序列模式挖掘算法:可以被用来发现数据的前后关系,挖掘出序列模式。
相关推荐







weixin_39840914
- 粉丝: 438
最新资源
- 创新图书馆管理系统提升信息检索效率
- 我印123:轻松DIY个性照片书和纪念册
- ADT 10.0.1版本更新详解
- XStream轻量级XML框架的源码包解析
- C#复刻Windows 7计算器功能与外观
- 电信报表系统开发:Struts框架与Oracle数据库实践
- 深入解析Linux设备驱动开发新技术与实践
- Visual C++中OpenGL应用程序开发入门
- 安装Aptana插件,让Eclipse成为JS开发利器
- MudBox 2012简体中文汉化教程:轻松实现界面汉化
- 超级终端:图形化telnet/SSH软件利器
- 可指定分布概率的图像椒盐噪声掺杂方法
- 简化清理Windows Installer工具介绍
- 自由天空版系统清理与减肥程序使用指南
- C#源码解析:视频会议系统设计与实现
- 西安交大复变函数第四版习题全解
- 深澜宽带认证客户端:跨平台登录解决方案
- SVN使用教程与配置指南
- 深入解析Android ADT-10.0.0新特性与文件结构
- PT2313L音频处理器CMOS技术应用指南
- C#控件设计与常用属性整理
- 使用Delphi控制Flash文件并更改背景颜色
- Windows 7推荐虚拟光驱软件分享
- Struts2初学者项目:品红网站成品