基于双阈值Apriori算法和非频繁项集的关联规则挖掘方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:elrshay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对从数据集中的正负关联规则挖掘问题,提出一种基于双阈值Apriori算法和非频繁项集的挖掘方法。首先,对通过逆文档频率(IDF)对语料库中的项(项集)进行加权,筛选出前N%的项集;然后,通过提出的双支持度阈值Apriori算法来提取频繁项集和非频繁项集,以此降低非频繁项集的数量;最后,通过置信度和升降度阈值的判断,分别从频繁项集和非频繁项集中挖掘正负关联规则。其中,创新性地利用了非频繁项集来挖掘正负关联规则。在一个医学文本数据集上的实验结果表明,提出的方法能够有效地挖掘出正负关联规则,且能够大大降低项集和规则数量。
其他文献
目的 :探讨炮制对山楂中有机酸含量的影响。方法 :采用滴定法对山楂生品、5种不同炮制品及现代烘品进行含量测定。结果 :山楂不同炮制品有机酸含量与生品比较均呈显著性差异
职业院校的职业道德教育是影响学生从业生涯中职业素质及职业道德操守的重要因素。目前,关于职业道德教育类的研究大多附属于经济功利论及职业技能论上,而忽视了"以人为本"的
为了获得5A90铝锂合金板材在加热状态下的成形极限图,采用自行开发研制的热环境通用板材成形性能实验机以及网格应变自动测量分析系统,进行5A90铝锂合金板材在10 mm/min的变
专业承诺作为影响大学生学习心理和职业心理的重要因素,对于大学生专业思想稳定,学习动力激发,取得学业成就,合理规划职业至关重要。本文从专业承诺的概念及结构、大学生专业
作为人们了解高等教育信息和高校发展情况的重要途径,大学排名正受到越来越多的关注,也引起了诸多激烈的争论。基于此,在回顾我国大学排名历史发展的基础上,总结近20年来大学
阳光体育运动活动的深入开展,迫切要求建立一个与之相适应的评价体系。它关系到新时期整个学校体育改革发展的方向,更关系着亿万青少年学生的健康成长。本文通过文献资料法、
开展采煤塌陷区土壤肥力研究,对土地复垦具有重要的指导意义。为了提高神东矿区采煤塌陷区土地复垦和植被恢复水平,本文在对神东矿区活鸡兔采煤塌陷区土壤机械组成、pH值、有
党的十七大报告指出:"社会主义核心价值体系是社会主义意识形态的本质体现。""建设社会主义核心价值体系,增强社会主义意识形态的吸引力和凝聚力。"胡锦涛总书记在纪念党的十
金属卟啉的合成及其在催化领域的应用是目前国内外研究的热点之一。本论文从5-(4-氨基苯基)-10,15,20-三苯基卟啉(ATPP)出发,合成了一系列金属卟啉及其高聚物负载衍生物,并考