大数据背景下的关联规则挖掘算法研究

来源 :长沙理工大学 | 被引量 : 2次 | 上传用户:json03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会进入信息时代,大量的信息和数据成为了这个时代的特征。挖掘数据中隐藏的信息变得尤为重要,其中关联规则挖掘有助于确定数据库中对象之间的关系,并在许多决策系统中扮演着重要角色。然而,当下人们对于大数据的认识还是不够,对关联规则挖掘更是缺乏了解,不管是国内还是国外,对这方面的研究有着广泛的研究前景。本文主要是研究关联规则挖掘算法,主要工作如下:第一,对现有的关联规则挖掘算法以及相关改进研究进行了总结和分类,分析了现有的关联规则挖掘存在的问题,并对未来的研究工作进行了展望。第二,提出了一种基于矩阵压缩的加权关联规则挖掘算法,通过扫描一次数据库,将其转换为0-1矩阵,避免了多次扫描数据库的问题,然后,根据相关性质对矩阵进行压缩,降低算法执行过程中的计算量;同时,考虑到项目具有不同的重要性,采取了加权的方法;且本算法在挖掘过程中能直接查找高阶频繁项集。实验结果表明,本算法能有效提高关联规则的挖掘效率。第三,提出了一种基于启发式搜索的并行化关联规则挖掘算法,采用位图排序来提高最大频繁事务的搜索效率;引入贪婪机制,确保算法各个阶段的优越性;运用启发式搜索,保证挖掘最大频繁项集的效率和可靠性;在Spark平台中并行化执行算法,进一步提高算法的运行效率。实验证明,本算法挖掘关联规则的效率和精度都更好。
其他文献
由《质量与认证》杂志社主办的2016检验检测认证行业年度风云榜发布会暨颁奖典礼在北京举行。国家质检总局科技司副司长丁吉柱,国家认监委副主任王大宁,中国检验认证集团副总
通过问卷法对678名中小学生进行了心理资本、理性思维风格和学习自主性对学习效能进行调查,发现并分析学习自主性和理性思维风格在心理资本与学习效能之间起的序列中介效应。
教师要完成"传道、授业、解惑"的任务,除了备课、上课、批改作业,除了爱岗、敬业、责任之外,还应关注学生的兴趣、爱好、需要、未来发展,做一个有智慧教师。一个有智慧的教师
腹部皮瓣移植术是在腹部切取创面所需要的皮肤和皮下组织,并在切取过程中保留部分组织与腹部相连,用于覆盖另一部位创面的手术方法。术后因患者供区(腹部)与受区(本文所指受区为
在构建的用电检查员潜能类岗位胜任力模型的基础上,采用主成分分析法对评价指标进行主成分提取,建立潜能类岗位胜任力综合评价模型,以全面、客观的方法对潜能类胜任力进行评
目的 利用品管圈(QCC)提高药品两票制查验合格率。方法 选取江苏省淮安市妇幼保健院2018年1—8月的两票制查验信息为研究对象,将QCC工具运用于药品两票制查验工作以提高查验
<正>GB2760-2007《食品添加剂使用标准》于2008年6月1日正式实施。该标准规定了22类1800多种食品添加剂的使用原则和范围,其中添加剂290
党的十九大报告中对于职业教育的重视,充分体现了当今新时代背景下,职业教育的重要地位,作为中职教师如何充分利用改进教育、教学方式,让中职生通过掌握专业技能完成基本教学
针对纵向数据下的广义线性模型,为了有效控制离群点对估计的影响以及进一步提高估计的效率,利用二次推断函数(QIF)改进加权的指数得分函数,得到了模型参数有效且稳健的二次推断
利用芦苇构建单室湿地阴极型升流式微生物燃料电池(microbial fuel cell-constructed wetland,MFC-CW),研究阴极基质材料的种类、粒径及进水COD浓度对MFC-CW的产电和污水净化