关联规则挖掘算法的研究及其应用

被引量 : 0次 | 上传用户:tianming2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库应用的不断深入,数据库的规模急剧膨胀,人们需要对这些数据进行分析,从中发现有价值的信息。数据挖掘致力于数据分析和理解、揭示数据内部蕴藏的知识。近年来,它的发展已经引起了信息产业界的极大关注,有着广阔的应用前景,并成为当今研究的热点。关联规则是数据挖掘领域中的一个非常重要的研究课题,广泛应用于各个领域,既可以检验行业内长期形成的知识模式,也能够发现隐藏的规律。有效地发现、理解、运用关联规则是完成数据挖掘任务的重要手段,因此对关联规则的研究具有重要的理论价值和现实意义。本课题即对数据挖掘中的关联规则进行系统研究,主要包括以下内容:1、数据挖掘技术的分析与研究。对数据挖掘技术的产生进行了简要的回顾,在提出数据挖掘基本概念的基础上,对数据挖掘的对象、可发现的模式和经常使用的技术进行了详细的分类和总结。分析了数据挖掘技术的研究现状,对数据挖掘技术的热点研究领域进行了探讨,为本课题的全面开展奠定了基础。2、关联规则的研究与分析。在对现有的关联规则文献研究的基础上,本文对关联规则的种类进行了全面地分类和总结,详细地介绍了关联规则的基本概念和基本性质,对关联规则的典型挖掘算法及其基本思想进行了分析和研究,讨论了提高该算法效率的各种优化技术,并且客观地分析了它们的优缺点。3、在传统的关联规则挖掘算法中,广泛采用了“支持度—置信度”的评价标准。然而在很多时候,挖掘出来的关联规则其支持度和置信度都很高,却没有实际意义。针对上述问题,本文引入了关联规则的一个兴趣度的度量——相关支持度( S_R),将支持度、置信度和相关支持度一起作为有效关联规则的评价标准。4、分析经典频繁项集挖掘算法Apriori算法,针对该算法中存在的效率瓶颈问题,提出了一个改进的挖掘算法——MM_Apriori(Multiply_Matrix_Apriori),并实现了该算法。改进后的算法通过频繁1-项集生成矩阵的转置MT与矩阵M相乘来获得频繁2-项集,从而减少了Apriori算法生成频繁2-项集的时间开销。理论和实验证明,改进的算法具有良好的性能。
其他文献
本文以学习型学校的理念为前提,从应然的角度对中小学校长领导研究进行进一步的探索。 本文第一章分析和梳理了以往对学习型学校的研究成果,总结归纳了学习型学校的理念,作为
女画家李青萍出生于上世纪初,是中国西画早期发展中的先锋人物,在上世纪四十年代取得了相当大的成就,有着非常高的声誉。五十年代后,她在政治风波中遭受巨大冲击,逐渐淡出人们的视
在我国现今,玩忽职守罪是一个含糊不清、争议颇多的罪名。在司法实践中,玩忽职守罪常常被滥用,远远偏离了玩忽职守罪立法的良好目的。笔者综合考虑玩忽职守罪的立法目的、现
本文分别以08Al钢板和AZ91D镁合金为基体对光亮纳米锌镍合金涂层进行了研究。08Al钢板是在碱性锌酸盐电镀液中通过电镀方法直接获得纳米锌镍合金涂层,本试验合成了一种添加剂
企业人力资源的开发和管理变得尤为重要,人力资源管理中对“人”的激励是一个重要内容,创建一个科学、公正、有效的激励机制是每个企业管理者的工作目标和重要使命,但要实现激励
m组织工程技术是再生医学中的一个重要组成部分,而支架材料是组织工程的重要因素之一.由于天然聚合物支架材料具有不同的生物学特性,如生物相容性、生物可降解性等,使他们可
我国保险行业经历了高速发展后,形成了国内和国外多家公司竞争的市场格局。在全球范围的激烈竞争当中,服务质量和顾客满意成为其竞争成败的关键因素,财产保险保单的续购和推荐也
《中国佬》(China Men,1981,又译《金山勇士》或《金山客》)是美国华裔文学的领军人物汤亭亭的作品。作品通过对“我”家族四代男性在美奋斗的辛酸历史的书写,再现了华人在异
目的探讨分析应用延续性护理对改善老年糖尿病患者自我护理能力的临床应用效果。方法选取2015年8月—2016年8月该院收治的120例老年糖尿病患者,随机将其分为两组,对照组(60例
目前,结构可靠性研究只停留在结构构件的层次,与实际的情况不符。结构体系可靠性理论的应用可以弥补这一缺陷,将结构可靠性的研究拓展到结构体系的层次,有利于提高可靠性研究