数据挖掘技术中关联规则算法的研究

被引量 : 0次 | 上传用户:gg236624
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数据库技术的迅速发展,数据存量大量增加,数据挖掘技术变得越来越重要,从而引起了各个学术领域的研究人员的兴趣,数据挖掘旋即扩展到各个领域。关联规则挖掘是数据挖掘中最活跃的研究方法之一。数据挖掘作为一种用于从大规模数据集中提取潜在有用的信息和知识的技术,越来越得到广泛的研究和应用。而关联规则挖掘作为最初推动数据挖掘迅猛发展的一个重要因素,被广泛应用于大型零售组织的决策支持中,它为确定市场策略、提高决策支持能力提供了有力的技术和工具保证。本文对数据挖掘技术,尤其是关联规则数据挖掘技术进行了系统、深入、全面、详尽地分析和研究,主要包括以下一些内容:数据挖掘技术的分析与研究。对数据挖掘技术的国内外研究现状进行了广泛而全面地归纳、分析和研究,对数据挖掘的定义及功能进行了简要的回顾,对数据挖掘技术的未来发展趋势和热点研究领域进行了总结和探讨,在数据挖掘基本概念的基础上,对数据挖掘常使用的技术和研究的对象进行了详细地分类、归纳和总结。为本文的全面展开奠定了基础。关联规则数据挖掘技术的分析与研究。在介绍关联规则基本概念的基础上,对关联规则的Apriori算法进行了详细地分析和研究,并就目前针对提高该算法效率的各种优化技术也进行了详细地描述,在此基础上提出了两种改进的Apriori挖掘算法。一种基于无向项集图的动态频繁项集挖掘算法,当事务数据库和最小支持度发生变化时,该算法只需重新遍历一次无向项集图即可得到新的频繁项集.该算法不仅简单、只需扫描一次数据库,而且还具有搜索速度快、节省内存空间等优点。另一种基于垂直事务列表的树形结构的挖掘算法,该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。
其他文献
<正>《山东体育科技》是由山东省体育局主管、山东体育科学学会和山东省体育科学研究中心主办并公开发行的体育科技期刊,系全国中文体育类核心期刊。国内统一刊号为CN37-1011
针对毛纺印染废水特点,采用了厌氧流化床-生物接触氧化法进行处理。运行结果表明,在进水COD平均为1700mg·L-1、BOD5450mg·L-1、色度300倍的条件下,上述指标去除率分别为95%
特征降维是模式识别领域对高维数据分析的重要预处理步骤之一。在信息时代的科学研究中,不可避免的会遇到大量的高维数据,如人脸检测与识别、文本分类和微阵列数据基因选择等
偏振模色散(PMD)是光纤通信系统中由于不同偏振模式传播速度不同而引起的脉冲展宽现象,并由此限制光纤通信系统的码率和中继距离的提高。解决光纤传输中偏振模色散问题是实现
<正> 魏稼教授擅长刺营疗法,自50年代始便将该法应用于治疗咽喉科急症。数十年来,他深入研究《内经》以及刘河间、张子和、李东垣、罗天益、朱丹溪、李(?)、薛立斋、郑梅涧、
<正>以下内容为《父母必读》杂志与新浪网亲子中心共同商议的话题。我们每月月初在亲子中心公布这个话题,然后从中选摘部分精彩内容刊登在《父母必读》杂志的"触摸互联网"栏
期刊
<正>家居建材产品"在学习中购买,在购买中学习"的特点,让很多顾客不敢贸然跑到网上下单,同时由于家居建材产品本身的一些属性,导致了很多产品不适合做电商销售。面对移动互联
本文主要对创设数学教学情境的策略进行研究。数学教学情境激发学生的学习兴趣,能充分调动学生的学习的积极性,充分调动学生的“知、情、意、行”协调地参与到课堂教学之中。
党的历次代表大会和各种政策文件,都反复强调要发展社会主义民主政治,并提出了政务公开、透明的要求。我国启动行政信息公开制度已经十年有余,虽然积累了一定的实践经验,但总