基于兴趣度的关联规则挖掘

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:allpass001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一类深层次的数据分析方法,被认为是解决“数据爆炸知识贫乏”的有效方法之一。关联规则挖掘是数据挖掘的重要模式之一,由于它能够较好的捕捉数据间的重要关系,并且发现的规则形式简洁易于理解,近年来,已经成为数据挖掘领域的一个热点。本文对关联规则挖掘进行深入研究并提出新的规则挖掘方式,主要包括以下内容。首先,对Apriori算法及其改进算法进行了深入研究,并针对算法的缺陷提出一种新的改进算法-SHAI-FP-growth算法。SHAI-FP-growth算法是在FP-growth算法的基础上针对FP-growth算法的伸缩性和实用性差的缺点,加入了划分思想和筛选理论改进而成的算法。试验证明该改进算法能有效减少产生候选集的数目,并能有效减少扫描数据库的次数。从而在时间复杂度和空间复杂度上都得到大的改进。其次,对现有的各种关联规则兴趣度进行深入研究,并结合客观兴趣度和主观兴趣度的优点,提出了一种新的综合考虑主客观因素的PSA(Piantesky-Shapiro- Accuracy)兴趣度。通过试验证明基于新兴趣度得出的规则实用性强,且效率高。最后,在新兴趣度(PSA)和改进挖掘算法的基础上,提出基于PSA兴趣度的关联规则挖掘的方法,最后通过试验进行分析。
其他文献
相关反馈的目标是从用户与检索系统的实际交互过程中进行学习,发现并捕捉用户的实际检索意图,并以此修正系统的检索策略,从而得到与用户实际需求尽可能相吻合的检索结果。将
企业的信息化使得企业对IT服务的依赖日益增强,为了更有效的提供IT服务,ITSM应运而生。ITIL做为IT服务管理的最佳实践,被全球广泛使用。虽然ITIL标准在很大程度上满足了业务
在信息系统的开发过程中,客户端界面的开发已经实现了自动生成,而服务端业务流程由于自身的复杂性,其自动生成技术还处于研究阶段。面向方面编程是对面向对象编程的改进,能够封装
准循环低密度校验(Quasi-cyclic Low-Density Parity-Check,QC-LDPC)码是目前信息领域和通信界最热门的研究方向之一。由于其校验矩阵具有准循环的特征,因而可以通过线性移位寄
目前,分布式信息系统之间仍存在一定的互联、互通、互操作问题,对现有遗产系统进行系统集成是信息一体化建设的一种重要手段。集成需求和Internet环境的多变性,对系统集成提
随着城市化进程步伐的加快,机动车辆数量不断的增长,城市的交通运输系统面临着巨大的压力。而以基于计算机视觉的运动车辆检测与跟踪技术为主的智能交通系统是解决该问题的有
CT图像具有较高的密度分辨率,能很好地显示密度差异较小的组织,但较高的辐射剂量限制了CT技术在大规模人群普查、肺癌等高危人群检查中的应用。针对上述情况,临床上采用降低
如今,以电信网、广播电视网和互联网等三大网络高层业务应用融合为目的的“三网融合”已成为通信业的研究热点,这也为视频会议、视频点播、远程教学等视频行业的发展提供了良
自从香农信道编码定理的提出之后,一些学者根据香农的思想,给出了一系列设计好码和有效译码的方法。在经历了近60年的发展之后,纠错码无论是在理论上还是实际中都得到了飞速
随着视频压缩技术与网络技术的不断发展与应用,越来越多的人们开始享受到多媒体带给人们在视觉与听觉上的乐趣,特别是人们对高清视频的体验越来越强烈。目前新一代的视频压缩标
学位