基于粗集理论的关联规则挖掘研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:zsjingling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种新的处理不确定性知识的数学工具。近年来,粗糙集理论在知识发现中的应用已取得了很大的进展,基于粗糙集理论的方法逐渐成为数据挖掘主流方法之一,而在数据挖掘的知识模式中,关联规则是比较重要的一种。关联规则挖掘就是在数据集中寻找给定项之间的有趣关系,而传统关联规则挖掘只能挖掘布尔型关联规则,且效率低。在信息系统中获得模板的基础上,基于粗糙集理论的关联规则挖掘,将可以挖掘更广泛的关联规则,并有助于提高所获规则的简洁性。 近年来,粗糙集理论在决策信息系统的属性约简和决策规则的抽取方面已取得很好的成果。本文借用粗糙集理论中α-约简的概念,提出了一种新的启发式关联规则挖掘算法,可以获取近似最优强关联规则。在已获得模板T和原信息表的基础上创建一张新的决策表,先通过将组成模板的描述子的知识量作为启发函数——知识量大的描述子优先成为候选α-约简集中的元素,再通过对候选α-约简集中的元素进行计数,从而选择满足阈值的约简集作为最终的近似最短α-约简,也即通过运用启发式算法求描述子集的近似最短α-约简来进行关联规则挖掘,最后通过“相关系数”对提取出的强规则进行筛选,以得到最终有趣的关联规则。通过示例,验证了本文提出的有关启发式算法相关理论,此法可以求得基于模板T的近似最短α-约简,快速挖掘出尽可能多的关联规则。本文提出的将粗糙集理论运用于关联规则挖掘的算法,弥补了经典关联规则挖掘方法的不足,有助于提高挖掘效率,拓宽关联规则挖掘范围。
其他文献
协同工作(Computer Supported Cooperative Work:CSCW)是一个多学科交叉和支持的新兴研究领域,它是最新信息技术与人类社会传统的协作方式相结合的产物。 然而基于传统分
预测是一种根据已知数据在过去一定时间段内呈现出的发展的规律性对未来发展趋势进行描述的行为。近年来,预测被用到了很多领域,如电价预测、股票价格预测和气象预测等领域。
SIP(SessionInitiationProtocol)应用服务器作为一种轻量级的软交换应用服务器解决方案,也在近两年日益赢得人们的青睐。然而在大呼叫情况下,应用服务器的业务处理能力成为了应
随着计算机网络技术的迅猛发展,越来越多的企业依赖网络来实现办公自动化和开展商业交易活动,然而,由于企业电子公文涉及到企业的商业秘密及其核心利益,而电子公文在网络中传送时
随着计算机网络技术和多媒体技术的发展,Internet正在成为许多实时多媒体应用的重要载体,如音/视频会议、网络直播、网络游戏等。这些需要高带宽低时延的应用对组播通信服务
自1993年美国首次提出“电子政务”(E-Government)概念以来,一场政府政务模式全面变革运动正在全球范围内轰轰烈烈的进行着;至今,十几年来的建设效果证明,电子政务的深入发展,极大
二十一世纪是信息技术高速发展的时代,随着移动互联网的高速崛起,随时随地的信息交流成为人们日常生活中不可缺少的一部分。伴随着信息技术高速发展的网络信息安全问题,也逐
随着互联网的迅速发展,分布式环境下的跨多自治域访问已经成为可能。多域间的跨域访问提供了一种分布式的资源共享的方式,从而提高了资源的利用率。同时,多域间的访问引起的安全
集成了计算机技术、通信技术、半导体技术的无线传感器网络能够根据用户的需求对各种监测对象进行实时的信息采集、处理,具有非常广泛的应用前景,对扩宽人类的认知领域、改变
地下管网是现代化城市一个既庞大又重要的公共供应网络,具有种类繁多、结构复杂、数据量大等特点。积极研究将先进的计算机理论和技术稳妥地应用于管网日常维护、规划和建设,有