带否定关联规则挖掘算法的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:miracle_l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘作为数据库研究领域中的热点,正受到越来越多的关注。它被定义为在数据中寻找正确的、有趣的、潜在有用的并最终可以理解的模式。基于关联规则的挖掘是其中一个重要的研究方法,具有重要的理论价值和广泛的应用前景。关联规则中最有名和最有影响力的算法是Apriori算法,Apriori对布尔型数据库的标准关联规则的挖掘有很高的效率。在很多领域中,只挖掘出标准关联规则是不够的,需要对数据项的否定项进行挖掘。带否定项的关联规则是指允许在关联规则中出现负项目,对关联规则的形式做出了扩展,从而提高了关联规则的描述能力。 Apriori算法在挖掘带否定项的关联规则时显得非常笨拙和低效,不擅长处理相关性高的数据,CA算法对稠密型数据库有很好的效率,但是挖掘出来的规则会很多,并且很多规则可能是无趣的。针对这种不足,INA算法在支持度-置信度的模式上增加了一个新的评估参数-兴趣度。通过引入兴趣度,有效的改善了CA算法中的候选集膨胀现象,删除了一些被挖掘出来而没有兴趣的关联规则。这种算法能够有效挖掘出有趣的带否定关联规则。INA算法在多维数据库中挖掘带否定关联规则也有较好的效率,更广泛的应用了带否定关联规则的挖掘。对于多维数据库,采用与数据仓库相结合的方法,利用数据仓库联机分析的一些结果,能够更好的挖掘带否定关联规则。通过初步实验将CA算法挖掘出的频繁项目数与Apriori算法挖掘出的正频繁项目数进行了比较,显示了CA算法的有效性,同样将INA算法挖掘出的有趣规则与CA算法挖掘出的规则进行比较,表明了INA算法的实用性。
其他文献
多线程机制对于操作系统来说是至关重要的。NCOS作为一个基于网关安全平台的专用操作系统,在充分考虑到网关安全操作系统的灵活性和健壮性的同时,却忽略了一个重要的方面:即
本文主要讨论了自然场景特别是草地的模拟和绘制。草地的地形是通过人工输入和随机分形的方法生成。植物在草地中的分布使用随机的方法。单株植物的造型则是采用上下文有关的
随着系统集成技术的快速发展,消费电子类产品已经超越传统的单一功能模式,正朝着一体化,智能化,无线化方向发展。单一功能的音频、视频产品已不能完全满足消费者的要求,因此,
近几年来,分组交换的应用越来越广泛,而且逐渐超过通过电路交换,大有取而代之的趋势.随着对分组交换的进一步研究与广泛使用,其高性能价格比的优势变得更加明显,人们也乐于采
本文的主要贡献与创新点: 1 提出了基于UML 的CISR体系结构描述方法及思想 在本文中首次尝试用UML 来完整的对C 4 ISR 进行建模描述通过对C 4 ISR 体系结构框架的深入研究
该文系统研究了在一个为空间网络和服务设施规划问题开发的基于知识的决策支持系统中,如何应用人工智能技术的专题.将人工智能AI整合到决策支持系统DSS导致了产生了被称为基
IDS在网络安全体系中占据着重要的位置。然而当前的IDS技术都有自己的缺陷:异常检测误报率太高,目前还难以在市场得到应用;误用检测的攻击特征不能实时更新,容易导致漏报,同
快速增长的海量数据促进了数据挖掘技术的发展,现实世界中80%以上的数据都具有空间属性,数据和空间属性的集合称为空间数据,系统由于包含空间数据具有空间属性.空间数据的复杂
多播是目前网络中研究最多、应用最广的通信方式.实现多播路由是解决多播通信的关键问题之一,而实现多播路由的一般方式是建立多播树.多播路由算法主要用来建立一棵性能好的
软件体系结构中,异构结构趋势越来越明显。中间件的发展为异构结构匹配提供了新的思路,其中数据库中间件是所有中间件中应用最广泛、技术最成熟的一种。它能有效地屏蔽对不同数