数据挖掘中关联规则算法的研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:oicq35952268
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘中热门的研究方向之一。随着数据规模的爆炸式增长,传统的关联规则挖掘算法时间效率过低,如何提高算法的时间效率是关联规则挖掘的主要研究内容。本文从二元属性和多值属性两个方面展开对关联规则算法的研究。一方面,本文深入研究了基于二元属性的布尔关联规则算法Apriori算法,针对其候选项集规模庞大、计数过程较慢的缺点提出了一种基于Hash树的并行计数改进算法,算法从三个方面改进,第一,对频繁项集进行裁剪,降低连接产生的候选项集的规模;第二,使用Hash树存储候选1项集,加快支持度计数过程,从候选2项集开始,利用事务和项集已按字典序升序排列的特点,改进Apriori算法的计数过程;第三,充分利用多核CPU的优势,使用多线程技术改写计数过程实现并行计数。通过实验对Apriori算法和改进算法进行性能测试,结果表明,改进算法的时间性能大大提升。另一方面,本文深入研究Apriori算法处理多值属性数据集的过程,指出其处理过程中产生的无效项目集过多的问题,针对该问题,提出一种减少无效项目集数目的优化算法,该算法剔除了同一属性不同属性值连接产生的项集,从而降低了候选项集的规模。实验结果表明,优化算法的时间效率更高。
其他文献
沥青路面的黏层对于路面路用性能影响很大,用乳化沥青作为黏层材料有一定技术优势。为了减少沥青路面病害,研发沥青路面的黏层沥青材料。为了检验研发的黏层乳化沥青性能,进
目的研究早期心理护理干预对脑梗死后抑郁患者康复的影响。方法将90例脑梗死后抑郁患者随机分为研究组和对照组,研究组在常规治疗护理的基础上给予早期心理干预,对照组仅给予
通过调研和论证,确定了模具设计与制造专业人才培养目标,进而召开实践专家访谈会,确定典型工作任务是板材冲压成形工艺制订和板材冲压成形模具设计。依据学习目标、学习内容
<正>在企业实现有质量、有效益、可持续发展的战略任务中,充分发挥好先进工匠的示范和激励作用,对于教育、引导广大职工牢固树立正确的世界观、人生观和价值观,鼓舞士气,凝聚
2003年7月1日凌晨,上海市轨道交通4号线浦西段隧道连接通道施工时发生事故造成近70m防汛墙被严重损坏.本文介绍该段防汛墙抢险工程的措施及其成果评价.
为提高Mn基催化剂的甲烷低温催化燃烧活性,以H-beta分子筛作为催化剂载体,采用浸渍法通过Ag改性制备了Mn-Ag/H-beta催化剂;在固定床反应器中研究了Mn-Ag/H-beta催化剂在低温(5
线上得到了广泛运用。在应用中的经验是:库底斜槽内物料流量控制采用手动流量调节阀比电动流量调节阀好,库的检查门采用双门结构较单侧门好;在库内开式充气箱的安装中应严格重视
分析了GIS技术应用、服务于濒危野生动物资源管理领域的背景,以濒危野生动物资源管理相关部门应用需求为基础,提出了基于GIS技术的濒危野生动物资源管理地理信息服务系统架构设
试验在湖南新五丰股份有限公司湘潭原种猪场进行,共设杜洛克(D)、长白(L)、大白(Y)猪和长&#215;大(LY)、大&#215;长(YL)、杜&#215;长大(DLY)6个组,每组选取健康、体重25 kg左右的猪12头,
目的探讨整体护理对胰腺癌患者治疗依从性和术后康复的影响。方法选取2016年2月至2018年2月商丘市第一人民医院收治的70例胰腺癌患者,按随机数表法分为对照组和观察组,每组35