关联规则数据挖掘频繁项目集发现算法的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ilovebaidoudou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则数据挖掘则是数据挖掘的一个主要研究内容。而频繁项目集的发现是关联规则数据挖掘的核心问题。 本文充分论述了典型的频繁项目集发现算法Apriori算法、Apriori_Tid算法,及已有的对于频繁项目集发现算法相关的改进措施的优缺点。在此基础上,本文给出了对于频繁项目集发现算法的一些新的、有效的改进措施。首先提出了动态自适应的方法,明显减少了事务数据库的扫描次数;其次提出了逐渐减小事务数据库中事务记录长度的方法,大大地提高了频繁项目集发现算法的时间效率;最后在项目集的搜索方面,根据项目集的有序性,采用了二分法查找的方法,大大节省了系统在项目集搜索方面的时间。根据以上所提出的改进措施,又综合已有的改进算法的优点,本文给出了一个频繁项目集发现的新的算法——Apriori_Auto算法。该综合算法在减小数据库扫描次数、减少候选项目集的数量及提高算法用于搜索的时间效率等方面都得到了明显的有效的改进。
其他文献
近年来,随着宽带计算机网络技术的发展及视频技术的日趋成熟,IPTV应运而生。然而,视频具有带宽高、数据量大及实时性强的特征,这使得大量用户的同时点播常常造成网络带宽的瓶颈,网
随着电子政务的日益普及和广泛的应用,传统的行政事业运行模式正面临着严峻的挑战,如何以电子化、信息化的手段来提高其行政管理水平、行政效能和决策的准确性,从而更加科学有效
为解决日益增长的案件数量与有限的司法资源之间的矛盾,以及避免不同法官之间判罚尺度不统一导致的判决偏差,本文面向智慧检务,以刑事案件为研究对象,对基于计算机辅助的刑事
本论文来源于西安电子科技大学“211工程”标志性成果项目《宽带无线IP接入网络系统安全技术》。我们研究的《宽带无线网络集成认证平台》是它的一个子课题,研究的目的就是要
邮件在日常生活中被广泛使用,而垃圾邮件的传播大大影响了人们的正常生活,浪费大量的网络资源,造成大量财力人力的浪费。如何控制垃圾邮件的传播是各国正在研究的课题之一。如今
本文详细介绍了城市排水设备动态监测与管理信息系统的研究和实现。 随着我国社会经济的不断飞速发展和城市化进程的加快,城市排水体系也在不断的趋于完善。但是目前我国的
在20世纪90年代以来,随着移动通信的发展和普及,无线通信技术日益受到重视,其应用也越来越广泛。“最后一公里”的接入网技术开始从有线向无线发展,在这个背景下,无线城域网
随着互联网络的不断发展,网络安全的问题也越来越受到大家的重视。黑客工具和网络攻击手段的发展极为迅速,导致更多的网络和用户遭受损失,其中分布式拒绝访问攻击DDoS攻击因
人脸识别技术,因为具有极强的科学研究挑战性和潜在的广泛应用,一直是国际性的研究热点。人脸识别的关键步骤包括特征提取和分类。大多数人脸识别系统将人脸表示为基图像的线
报警系统是SCADA系统重要的组成部分。一个具备推理能力的智能化的报警系统可以帮助调度人员准确识别、定位已经发生的故障,总结故障原因,显示电力网络潜在的问题。 本文讨