Apriori算法的改进及应用

被引量 : 0次 | 上传用户:wang605631496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,数据资料的规模急速膨胀。于是,人们希望有新一代的技术和工具能够智能地自动地帮助人们分析已经消耗大量财力和物力所收集与整理的海量数据,以发现有用的知识,达到为决策服务的目的。因此,面对“人们被数据淹没,人们却饥饿于知识”的挑战,数据挖掘技术应运而生,并得以蓬勃发展。数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则挖掘是数据挖掘的主要研究内容。而频繁项目集的发现是关联规则挖掘的核心问题。本文重点研究了频繁项目集的发现算法及关联规则挖掘的应用,主要工作包括以下几个方面:1、研究了数据挖掘中的关联规则挖掘的步骤。对经典的Apriori算法和AprioriTid算法做了全面的分析,指出了关联规则挖掘中的关键步骤和频繁项目集算法的不足。2、针对Apriori算法的不足,提出了一种高效的频繁项目集的发现算法ZSApriori。该算法在计算支持度计数时,只扫描一遍事务数据库,减少了事务数据库的扫描次数;在求k-候选项目集Ck前,先判断k-1频繁集Lk-1中的项目个数是否小于k,若小于k,则Ck=Φ,此时不再需要进行连接操作来计算Ck,尤其当k值很大时,可以节省大量的计算时间;根据频繁项目集的性质,在计算候选项目集时,减少了候选项目集的数量。3、将关联规则挖掘应用到高校教学质量评价中。从教学评价数据中挖掘关联规则,找出课题教学效果与教师状态的关系,从而为教学部门提供决策支持信息,促使更好地开展教学工作,提高教学质量。4、将关联规则挖掘应用到高校就业分析中,发现学生的受教育属性和就业属性之间的关联性,找出社会需要的应用型人才的模型,从而给决策者提供指导和数据支持,改进现有的教育模式。
其他文献
本文是关于3-6岁幼儿同伴合作行为研究结果的呈现。研究者认为,幼儿同伴合作行为是指幼儿在与同伴互动过程中,为了共同的目标与同伴相互配合和协调,试图实现共同目标的行为过程
期刊
自孟子提出“良知”、“良能”说以来,良知与知识的关系问题,就已经存在了,《中庸》提出的“尊德性”与“道问学”正是对此问题的一种说明和处理。北宋,张横渠提出双重知——德性
压电陶瓷是一种实现机械能和电能相互转化和耦合的一类高技术功能材料,广泛应用于电子和微电子元器件。传统的陶瓷在应用过程中会引起许多问题。开发新型无铅压电陶瓷取代现有
本文理论部分对项目管理及其模式的概念进行了阐述,对项目管理的四种发展阶段即传统的单一项目管理模式、项目的群组管理模、企业项目管理模式、动态联盟的项目管理模式等进行
族徽文字是研究商周社会家族结构、家族形态、族氏关系以及文化礼俗的重要资料,但由于材料零碎分散、考释不易、分期断代困难,目前对其史料价值的认识和利用,尚存在较多的歧义和
本文通过大量的数据和事实阐明了我国“高考移民”现象的发展状况,深入分析了“高考移民”现象形成并演变成社会问题的政策因素、文化因素、教育因素。“高考移民”即考生为了
软件工程师是近几年来新兴行业的一个特殊群体的代表。相比较一般的工薪阶层,他们拥有良好的教育背景,经济收入相对较高,是人们羡慕的对象。但他们也要面临巨大的职业压力,迎接技
随着人们生活水平的提高,人们越来越重视食品安全。甲醛是一种严重威胁人类健康的环境污染物,但被很多商贩用作食品添加剂来改善食品的外观和用作防腐,使食品中甲醛的检测就显得
目的:通过正常大鼠及荷原发性肝癌大鼠肝动脉给药研究天冬胶作为血管栓塞剂的可行性。方法:给正常大鼠及经二乙基亚硝胺(DENA)诱发原发性肝癌大鼠肝动脉注射天冬胶,注射时在X