基于关联分类的动态关联规则趋势度挖掘方法研究

来源 :兰州交通大学 | 被引量 : 3次 | 上传用户:jiugeqingjiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是数据库知识发现的一个研究热点。数据挖掘一般是指从大量的数据库或数据仓库中搜索隐藏于其中的有着某种特殊关系性的规则或验证已知的规律。数据挖掘模式大致可分为回归、关联规则、时间序列、聚类和分类等模式。传统的关联规则挖掘只是针对事务数据库的一种静态的挖掘即认为规则不会随着时间而变化。但是从某些实际数据库中挖掘出来的关联规则具有时间特性,因此有必要把时间这一因素添加进来观察关联规则在时间上的变化,即动态关联规则。动态关联规则在挖掘过程中将时间进行等间隔划分,在支持度和置信度的评价体系下进行规则评价。在此基础上,引入趋势度阈值修剪对用户无价值的规则,避免生成无效的动态关联规则来提高挖掘质量,即动态关联规则趋势度挖掘。关联分类是通过引入一个带有类别标示符的训练数据集来建立关联分类器来对未知的数据对象进行预测。关联分类具有较高的分类精度和较强的适应性。但是传统的关联分类方法在算法的执行效率、剪枝的质量和效率以及分类的理解还存在有很多问题。本文在相关理论研究的基础上,将动态关联规则趋势度挖掘和关联分类方法结合起来,提出了基于关联分类的动态关联规则趋势度挖掘方法。在动态关联规则趋势度挖掘的基础上设计了基于优先规则兴趣度剪枝和兼容性特征向量的SVM分类器模型。利用动态关联规则趋势度挖掘方法生成类关联规则集,然后分别通过给定的优先规则兴趣度和兼容性特征向量进行剪枝得到最终的关联规则。算法在数据较少时发挥了关联分类的优势,对于规则的挖掘和预测有着较好的效果。通过实验数据的对比,验证了其在动态关联规则趋势度挖掘上的适用性和较高的精确度。通过数学模型分析规则的变化趋势,一定程度上解决了动态关联规则挖掘过程中如何选取支持度向量的问题。与近几年提出的动态关联规则挖掘方法相比,本文方法挖掘出的规则数目少、精确度高,有效的避免了动态关联规则挖掘的盲目性。挖掘出来的关联规则与传统关联分类方法相比有效的提高了预测精度和预测准确度。
其他文献
本文的写作基于如下的观点和事实:XML只是类型化值的多种表示方法中的一种,软件代理程序可以利用其进行数据互换和互操作,把XML语法视为次要的细节。XML 的Xpath 规范维持原
组态软件是指数据采集与过程控制的软件,可以非常容易地实现和完成监控层的各项功能,并能同时支持各种硬件厂家的计算机和I/O设备,与高可靠的工控计算机和网络系统结合,可向控制
当前我国正在大力普及高等教育,并提倡终生学习和继续教育,而我国目前的传统教育很难满足这一要求。进入90年代,Internet在我国得到了迅猛的发展,对人们的日常生活产生了重大
随着互联网的迅猛发展和普及,网络已经成为信息传播的主要渠道,人们可以方便的从网络上获得各种信息,但由于信息量巨大,并且网络信息的爆炸式增长,给人们快速准确地获取所需
软件配置管理是贯穿于整个软件过程的软件质量保证活动。在软件开发的诸多质量保障活动中,配置管理处于核心地位。基于构件的软件开发(Component.BasedSoftwareDcvelopment,简称
SIP是近年来快速发展的一种应用在通信呼叫控制领域的协议,它起源于Internet领域,对通信网络的架构产生了重大的影响。与传统通信协议不同,SIP协议完全采用文本编码,以方便脚
随着电信业务和技术的快速发展,中国的电信业形成了激烈的竞争格局,运营商目前关注于服务能力的提升,业务运营支撑系统正在成为运营商的核心竞争力。中国电信对支撑系统体系建设
随着新型网络应用的不断涌现和用户数量的迅速增长,使得Internet的流量急剧增长,越来越严重的网络拥塞问题逐渐暴露出来。Internet中拥塞控制机制对保证Internet的稳定具有十分
近年来,环境问题已经成为人类关注的焦点,越来越多的技术应用在保护环境中。随着网络技术、嵌入式技术和计算机技术的不断发展,如何将各种先进技术应用在工业监测领域,使得系
IP协议本身不具有任何的安全特性,易遭受如地址欺骗、内容窃听、数据篡改、重播等攻击。IPSec协议是一组开放网络安全协议,可以“无缝”地为IP引入安全特性,提供了包括访问控