引入约束因子的类BAR关联规则挖掘算法研究

来源 :上海海事大学 | 被引量 : 0次 | 上传用户:houzhuo111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘首要解决的是效率与伸缩性问题。由于数据挖掘任务所面对的数据集通常是由数以百万计的记录所构成的大型数据库或数据仓库,因此如何提高从大型数据库中挖掘关联规则的效率,以便有效的降低计算的复杂性、提高算法的运行速度,便成为关联规则挖掘研究中的核心问题。 同时,在关联规则挖掘中存在的一个问题是,那些支持度高的规则往往不是有趣的规则,因为这些冗余规则中相当一部分都可以利用用户所掌握的领域知识筛选出来:并且,用户对规则的要求也日益精确。这就要求对要挖掘的规则引入新的约束,本文引入的就是最小兴趣度和确信因子相结合的约束。最小兴趣度体现了用户的参与性,而确信因子是处理在B(?)A和A(?)B同时满足大于最小支持度,最小置信度的时候,如何来取舍规则的问题。 基于位图和颗粒计算的关联规则的挖掘算法(Bit-AssoRule简称BAR)比一般的apriori,apriori-id,apriod-Hybrid在运行时间上提高了一个数量级。本文介绍了基于位图的BAR关联规则的挖掘算法,提出了一种基于BAR算法的类BAR算法,讨论了如何将上述约束引入类BAR算法关联规则的挖掘过程中,并给出了BAR+算法,并将该算法和未改进的BAR算法进行比较,从理论说明引入约束因子后的BAR+算法,可以提高算法的效率。
其他文献
信息技术的飞速发展正在引发着一场深刻的生产和生活方式的变革,极大地推动着经济和社会的发展。建设“电子政府”已经成为世界新一轮公共行政管理改革和衡量国家及城市竞争力
互联网的飞速发展给人们的日常工作带来了前所未有的便利,随之而来的安全问题也越来越难以回避。受各种原因的驱使及攻击工具的增加与使用的方便,入侵事件日益猖獗。为了增强
本文对视频编码中的关键技术-熵编码技术进行了研究,针对高清晰度视频提出基于复合上下文的熵编码器,并进一步研究了算术编码器CABAC,提出新的8*8DCT系数的算术编码方法.目前
本文在对声音信号采集、特征提取以及场景分类技术等理论全面分析的基础上,提出了一系列新的时域特征提取方法如帧内平均峰值能量、帧内峰值能量方差、带通过零率等和各维特
本文首先分析了一些已有的自动评价方法,如孤立点测试法、BLEU/NIST方法、GTM方法以及智能度方法等,通过实验验证了他们在英汉翻译评价应用中的可行性,并针对汉语语言的特殊
本文对语音保密通信中必须经历的数模、模数转换过程进行了研究.文中讨论了音频信号在数模、模数转换过程中受到的影响,其中主要包括信道噪声、量化误差、时域漂移、幅值差异
随着现代工业技术的不断发展,机械设备运行周期越来越长,速度也不断变快,人民对于其安全性的要求也不断提高,为此,一种能够实时地检测出机械设备健康状况的方法就显得十分有必要。
目前,以SMP服务器作为结点的机群系统被普遍采用。由于单个结点上多个CPU的使用,机群对结点间的通信带宽提出更高的要求。虽然目前的高性能通信网络得到迅速的发展,但因受物
本文主要研究了设计模式组合技术及其使用,提出了采用UML及其扩展机制表示的用于支持设计模式组合方法的三个模型:模式级模型、带接口的模式级模型和细化的模式级模型,
随着人们对地理信息需求的不断增长和网络技术的飞速发展,GIS技术与网络技术相互融和形成了网格GIS技术。虽然目前网格GIS技术已越来越多地应用于各个领域,但国内农业灌区领