Rough集理论及其在数据挖掘中的应用

被引量 : 0次 | 上传用户:aaavvv001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究的内容集中在Rough集理论,以及Rough集理论中的粒度计算理论在数据挖掘领域中的若干应用。Rough集理论是一种处理不确定性知识的数学工具,围绕着数据挖掘领域中的问题,本文利用Rough集理论与粒度计算理论,提出了若干解决方案。本文对数据挖掘及Rough集理论进行了基本概述,完成的主要工作包括: 1.针对以往的基于Rough集理论发现知识方法的绝对化,以及推出的规则过于肯定或过于否定,提出了基于可信度函数的知识量化方法。 2.知识约简是在决策表上进行的,而决策表一致与否在约简之前要加以判断并进行区分。本文提出了基于条件概率的对非一致决策表的划分,在将属性分为条件属性和决策属性的基础上,把每个个体的条件属性作为条件,决策属性作为在该条件下要发生的事件,然后通过对概率的值来判断该个体是属于一致决策表的,还是非一致决策表的。这种方法避免了以往对非一致决策表划分时要进行等价类的划分,结合交运算以及求其正域,因此起到了简化的作用。 3.提出了基于二进制粒度计算的量化方法。首先,按照决策属性值对决策表进行重新整理,决策值相同的个体放在一起;建立一个二进制表;根据决策表推出规则,再由给出的可信度值计算所需求满足的个体的个数;然后按照规则所给出的属性值上的二进制数进行AND运算,通过判断“1”出现的个数来进行判断该规则的准确性。 4.在建立了粒与二进制数的对应关系的基础上,定义了粒度包含和粒度基数,并给出了相应的属性值约简算法。该方法通过二进制数的AND运算及粒度包含来判断哪个个体的哪个属性可被约去,不仅速度快,而且效率高,还有利于在计算机上实现。 最后,对全文进行了概括性总结,并指出了有待进一步研究和完善的问题。
其他文献
教务管理是高校教育信息管理现代化的基础及关键,教务管理从传统的人工操作到信息管理自动化、网络化是势在必行。本文结合我校教务管理的实际情况,给出了基于校园网的教务管理
随着应用服务模式从C/S 结构向Web 的迁移,企业必须面对一个新的挑战,即在不影响最终用户使用的前提下,实现在任何地方灵活地访问应用服务。SSL VPN(Secure Socket Layer Vir
本文研究了彩色图像的显示问题,分析了国内外该领域的研究现状,在动态范围压缩和色彩校正两个问题上,针对其核心技术(如调整映射曲线,Retinex,自动色彩校正等)提出了改进算法或是
“基于P2P的媒体点播系统的设计与实现”论文是结合科技部“十?五”重大科技攻关项目“网络教育关键技术及示范工程”的“非实时教学系统”课题进行的。论文旨在研究对等网络
入侵检测系统(Intrusion Detection System,IDS)作为一种主动的信息安全保障措施,有效地弥补了访问控制、防火墙等传统安全防护技术的缺陷,能有效的检测到入侵企图和入侵行为
随着计算机网络技术的飞速发展,社会对信息化的要求越来越高。传统客户端/服务器结构的应用已经不能满足不断扩大的发布、维护和升级应用程序的需要。此时,基于组件技术的三
无线多媒体传感器网络(Wireless Multimedia Sensor Networks,WMSNs)是一种分布式传感器网络,引入了诸如图像、声音、视频等各种多媒体信息。无线多媒体传感器网络结合了无线传感
近年来,心脏病的发病率和死亡率不断上升,已成为威胁人类生命健康的主要疾病之一。据统计,全世界约有1/3的人口死亡是因心脏病引起的,而我国,每年有几十万人死于心脏病。因此,对于
数字水印技术是信息安全研究领域中的一个重要课题,一直以来都深受人们的关注。网络技术的飞快发展给人们的生活带来了方便和快捷,然而,随着技术的加深,数据的真实性却变得不
在安全监控、生产过程监控、住宅小区监控等领域,远程监控系统已经被广泛应用,远程监控系统以其远距离监控的独特优势逐渐赢得了广大客户的青睐。随着控制技术和通信技术的蓬勃