基于粗糙集理论的不相容信息系统知识获取研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lichengjing626
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术、网络技术的迅速发展,人们在各个领域都积累了大量的信息。如何快速、准确地从杂乱无章的海量数据中挖掘潜在的有利用价值的信息,如何理解和解释已有的历史数据并用于预测未来的行为,这给人类的智能信息处理提出了前所未有的挑战,从而导致了知识发现领域的出现。  粗糙集理论作为一种处理不确定性信息的新型数学工具,能够分析隐藏在数据中的事实而不需要关于数据的任何附加信息,这使得采用粗糙集理论作为研究知识发现的工具具有许多优点。在粗糙集理论中,知识表达系统是信息系统(或决策表),而粗糙集理论最核心的内容便是知识约简,它也是用粗糙集进行知识获取时的主要过程。知识约简包括属性约简和值约简,前者是对决策表整体的一个约简过程,后者是对决策表产生的决策规则的进一步简化。在经典的粗糙集理论中,对属性约简有两种定义形式:代数定义和信息论定义。前者是根据决策表的正域是否发生变化来决定能否约去某些条件属性,后者是根据决策表的条件熵的是否发生变化来决定能否约去某些条件属性。当决策表相容时,两种定义对决策表处理的结果是一致的,而当决策表不相容时,结果往往不一致,而且结果没有反映出决策表中不相容样本所表达的信息。  为此,通过分析这种不一致性的产生原因,研究并发现经典粗糙集理论的两种属性约简定义在处理不相容决策表时的问题所在,认为应从决策表的最终用途——决策应用出发,来重新确定约简的思路,即不以是否改变决策表的分类能力作为约简的条件,而应将以是否改变决策表的决策能力作为约简的条件。  用决策能力作为约简的条件,必须首先要能度量决策能力。为此,提出了度量决策表的决策能力的方法——平均决策强度,并在此基础之上提出了基于平均决策强度的属性约简定义。同时,又用信息论的观点看待决策能力问题,提出了决策熵的概念及基于决策熵的约简定义。通过理论证明和实例验证,新提出的两种约简定义处理不相容决策表的结果是一致的。  决策规则集是约简的最终结果,也决策推理的主要工具。通过新的约简模型获得的决策规则集是满足平均决策强度条件的规则集,我们称之为MDP规则集。由于从决策表中计算MDP规则集运算量很大,如果能够从一个不完整的训练样本集开始学习,然后在应用过程中根据新来的样本对规则进行动态地调整,即要求系统具有增量学习的能力,那么将大大降低这种运算的复杂度。为此,提出了一种从决策表中增量获取MDP规则集算法,实验表明,该算法实用有效,特别适合一些动态变化的信息系统。  决策推理是知识获取结果的最终应用,在推理中希望有匹配率高的规则集和识别正确率高的推理方法。为此,提出了由MDP规则集获取适应度更广泛的增强的MDP规则集的方法,并给出了高决策强度的推理策略,通过对比实验,增强的MDP规则集在高决策强度推理策略指导下可得到更高的规则匹配率和识别正确率。  基于粗糙集理论的不相容知识获取研究不仅为知识获取提供一种新的视角和手段,同时也丰富了粗糙集理论的研究内容。
其他文献
该文在对客户/服务器体系结构的基本概念及其技术理论,数据库的安全防范措施作了比较详细的阐述的基础上,提出了设计与实现一个客户/服务器体系结构的数据库应用系统的方法和
该文首先介绍了数据并行的概况,通过对设计并行程序中,划分、通信及映射的简单分析,引出了不规则问题,在解释不规则问题的同时,还分析了当前对不规则问题研究的现状.并提出了
该文从技术角度对企业网建设中若干问题进行了研究和探讨.主要包括:主干网技术(交换式快速以太网、FDDI和ATM),路由技术,网管技术和WWW技术.该文对企业网规划的理论问题和一
网络安全是目前国内外数据通信领域的一个重要研究方向,人们开始开发各种各样的网络安全技术来保证网络安全,目前国内外主要从事网络安全协议、数据加解密算法、网络防火墙、
该文是以广东省建设信息中心Intranet网(GPCIS)开发实践为基础的.GPCIS是一个典型的Intranet
由于无线局域网(WLAN:Wireless Local Area Network)与有线网络相比具备移动性好、组网方便、运营成本低和投资回报率高等优势,加上近年来在覆盖范围、功率、带宽上取得了技术
该文主要以概率统计理论和遗传算法理论为依据,对实现DMIoDS中多媒体存储服务器的可伸缩性结构及其所涉及的接纳控制机制、条纹化技术和负载平衡策略等关键技术作了系统、深
该文完成了某省某市银行"天地对接"系统的设计与实现.论述了"天地对接"系统的工程总体目标、系统设计目标及工程实施意义,分析了该省该市业务发展现状及"天地对接"业务量,并
该文首先综合论述了与该课题密切相关的多个学科领域的发展现状,包括一维数字信号处理、语音信号数字处理以及人工智能等学科.在此基础上详细地讨论了课题开发过程中遇到的诸
该文主要致力于分布式对象计算的研究与探讨.首先讨论了分布式对象计算的概念、特性及优点,并对两种重要的分布式对象模型ActiveX/DCOM与OMA/CORBA进行了比较.Internet正渗透