关联规则数据挖掘算法的研究

被引量 : 0次 | 上传用户:allonwxg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘已经引起了信息产业界的极大关注,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果,对数据挖掘技术进行系统、深入、全面、详尽地研究是全球信息化发展的客观需要。本文对数据挖掘技术,尤其是关联规则数据挖掘技术进行了系统、深入、全面、详尽地分析和研究,主要包括以下一些内容: 数据挖掘技术的分析与研究。对数据挖掘技术的产生进行了简要的回顾,在提出数据挖掘基本概念的基础上,对数据挖掘的对象、可发现的模式和常使用的技术进行了详细地分类、归纳和总结。对数据挖掘技术的国内外研究现状进行了广泛而全面地归纳、分析和研究,对数据挖掘技术的未来发展趋势和热点研究领域进行了总结和探讨,为本文的全面展开奠定了基础。 关联规则数据挖掘技术的分析与研究。在提出关联规则基本概念的基础上,对关联规则的种类进行了全面地分类、归纳和总结,对关联规则的典型挖掘算法及其基本思想进行了详细地归纳、分析和研究,对各算法之间的差别进行了客观地比较,并通过实例说明了比较的结果。针对提高算法效率的各种优化技术也在这里被进行了详细地研究和讨论,同时客观地分析了它们的优缺点和利与弊,为HY算法的提出和构造建立了理论上的必要性前提。 HY算法的设计、分析与研究。针对经典频繁项集挖掘算法的不足,提出了进行关联规则数据挖掘的基于散列技术和优化的事务压缩技术的HY算法。散列技术部分针对关联规则数据挖掘的特点构造了一个有效的散列函数,在对它的构造原理、实现方法和效率等进行详细地分析、研究和论证的同时,还提出了“基规模度”、“组合存在度”、“组合稠密度”等几个新的概念。事务压缩技术部分在集合传统压缩方法优点的基础上,针对DHP算法中事务压缩技术的不足,提出了更优的事务压缩方法,并对该方法的操作原理和实现步骤进行了详细地分析和研究。通过一个实例给出了由HY算法进行关联规则数据挖掘的过程。最后,给出了新算法详细的算法实现步骤。 HY算法的实验结果。在构造基于泊松分布函数和指数分布函数的合 西南交通大学硕士研究生学位论文 第iii页成数据的基础上,对HY算法的性能及其与Apriori算法和DHP算法的比较进行了实验,这些实验包括针对不同的合成数据和不同的最小支持度,对各算法的执行时间进行比较的实验以及针对合成数据的不同的事务数和不同的项数对各算法的执行时间进行比较的规模实验,并对实验结果进行了分析,反映出HY算法具有良好的性能。 原型系统的实现。采用 VC++.net和 VB.net程序设计语g“,在 MicrosoftWindows 2000 Server、Microsoft SQL Server 2000以及 Microsoft Excel XP系统环境的基础上,构造了一个简单的数据挖掘原型系统,实现了HY算法、MDX查询和数据立方体的OLAP钻取。
其他文献
数字化医疗技术是口腔正畸领域发展的必然趋势,临床上开始使用正畸弓丝弯制机器人技术辅助弯制正畸弓丝,而正畸弓丝的数字化表达是机器人弯制的前提。由于人类牙齿排列的个性
<正>圣戈班集团是世界上历史最悠久的制造企业之一、最大的玻璃及建筑材料制造商之一及全球《财富》500强企业。今年,圣戈班集团迎来了350周年生日。在350年的发展历程中,圣
随着国内建筑市场的日益开放,国内建设项目将更多地涉及到国际工程,我国建筑企业在国际工程市场上将面临更激烈的竞争。基于我国招投标制度不够完善、建筑企业在国际工程市场上
电子商务对农村经济的发展具有积极影响,这已成为共识。本文对电子商务发展趋势、电子商务对农村经济的影响等相关研究进行了综述,进而提出当前相关研究存在的不足,指出了未
“模糊”的概念和理论是美国伯克利的加利福尼亚大学教授L.A.Zadeh,1965年最先在Information and Control上的一篇题为Fuzzy Sets的文章中提出来的。文中指出:在现实物质世界中
为确保变电站检修现场的安全,检修现场需装设围栏限制工作人员的活动范围。由于部分停电检修时考虑到检修电源接入、车辆进出,装设围栏面积较大,距离较远,故所需时间较长,占
以无阻力卫星的发展和相关技术为综述对象,首先介绍了无阻力卫星的概念,并比较无阻力卫星中位移模式和加速度计模式的区别和优缺点;其次分析了无阻力卫星的体系结构,将无阻力
进入21世纪后,跨国界的经营和人员流动已经成为全球经济的重要组成部分,跨国兼并和跨国战略联盟的增加使得跨国公司需要面对具有不同文化背景的管理人才和技术人才。这种全球化
目前,被称为“朝阳产业”和“无烟产业”的旅游业以其前所未有的速度迅猛发展,特别是近20年来取得了辉煌的成就。就我国旅游创汇而言,1978年我国居世界第41位,到1998年跃居世界第
汉晋时期,东北亚地区基本上纳入了中原王朝的大一统之下,但西晋王朝崩溃后,历史发生了划时代的变革。公元四至七世纪正是东北亚历史大变革的时期,在此时期东北亚地区群雄逐鹿,高句