快速分类关联规则挖掘算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:yufengjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代数据库技术的不断发展及其广泛应用,数据库中的数据量和复杂程度急剧增加,急需一种技术描述和发现这些日益重要的数据所包含的信息,以及它们之间的关系。数据挖掘正是这种用来从数据中抽取未知的、潜在有用的模式和关系的方法,以被广泛地运用于商务管理、生产控制、市场分析、工程设计和科学探索等。规则是数据库中模式之间的关系的一种描述,它是数据挖掘中的一个重要领域。一般情况下,规则分为两种,即事务数据库中为解决市场篮子问题的关联规则,以及关系数据库中用来预测的分类规则。本文主要关注的是用关联规则方法挖掘分类规则,即分类关联规则。关系数据库的数据密度通常大于事务数据库,用关联规则方法在关系数据库中挖掘分类关联规则,将会遇到很多困难,比如冗于规则过多。鉴于此,本文提出了一个最优分类关联规则算法——OCARA。该算法使用最优关联规则挖掘算法挖掘分类规则,并对最优规则集排序,从而获得一个分类精度较高的分类器。将OCARA与传统分类算法C4.5和一般分类关联规则算法CBA、RMR在8个UCI数据集上进行实验比较,结果显示,OCARA具有更好性能。证明OCARA是一个有效的分类关联规则挖掘算法。另外,在不完整的关系数据库中,维度较高时,将显著增加挖掘分类关联规则集的规模和挖掘规则所用的时间。本文提出了基于粗糙集理论的快速ORD关联规则挖掘算法,该算法首先采用基于粗糙集理论的属性约简算法进行属性约简,然后采用高效的冗余项集和冗余规则修剪算法——ORD算法获取规则,实验表明该算法具有良好的性能。
其他文献
Web应用系统中存在大量JSP页面需要进行服务器端测试,但是手工编写页面测试类不仅需要掌握服务器端测试相关技术,而且会产生大量重复性机械劳动。所以设计了基于Cactus的JSP
随着3G的迅速发展及各种移动增值业务的广泛应用,3G网络接入安全隐患和可能遭到的攻击也日益严重。针对3G安全体系中的网络接入的薄弱环节,入侵者可借助接入方面的漏洞对进行攻
胃上皮内肿瘤的病理诊断主要依靠病理医生凭经验对胃上皮内组织切片的细胞形态学特征进行分析判断,从而得出诊断结论。如何将胃上皮内组织切片的细胞形态学特征由定性判断转化
民用航空在当今社会中已成为国民经济发展的重要驱动力量。如何提高飞行安全成为我国民航快速发展中的一个不可回避的问题。目前,世界上一些发达国家将飞行数据运用于日常监控
移动通信业务的飞速发展,使得通信安全方面的需求愈发重要,应用在通信领域的智能卡——用户识别模块(SIM)应运而生。3G时代的用户识别模块——USIM卡将逐渐向多应用平台过渡,
将粗糙集理论应用于生物信息学,是上个世纪末以来许多科研工作者一直关注的研究热点,而且越来越多的被应用于生物信息学的各个方面,目前已在人工智能、知识与数据发现、模式
计算机支持的协同工作(CSCW)是目前国际上计算机领域研究一个的热点问题。多用户协作主要涉及两个问题:一是建立包括外部环境和协作成员的协作场景,为协作成员提供与外部环境和
粒度计算理论作为目前的研究热点,受到越来越多的关注。目前模糊集、粗糙集和商空间理论可以看作是三种不同形式的粒度计算理论。这三者在思考问题的出发点和解决问题的任务方
近些年来,随着无线宽带通信技术的发展,第三代移动通信系统(3G)正朝着以CDMA为基础,宽带化通信为特征的方向迈进。各式的移动终端设备如移动电话、PDA等,己逐渐成为人们不可缺少
随着我国大部分油田的开发进入中后期阶段,油藏的研究要求更高的定量化,储层的描述要求更加精细,实现精度较高的储层三维可视化非常有意义。本文介绍了随机游走方法在油田开发中