论文部分内容阅读
粗糙集模型是由数学家Pawlak首先提出的一种用于处理模糊和不确定性知识的新型数学工具,已经在机器学习、知识获取、决策分析、专家系统和模式识别等领域取得了一些成功的应用。但是,随着对粗糙集研究的不断深入,粗糙集模型的局限性也逐渐的显露出来,由于利用粗糙集处理的分类必须是完全正确或肯定的,这样致使大量有用信息在规则提取过程中丢失,粗糙集的这一局限性限制了它的应用。于是,近年来许多学者从多方面对粗糙集模型进行推广,出现了变精度粗糙集模型、概率粗糙集模型、广义粗糙集模型、模糊粗糙集模型等。
变精度粗糙集模型是在标准粗糙集模型中引入了正确分类率β,放松了对标准粗糙集模型近似边界的严格要求,增强了粗糙集模型的抗干扰能力和对新数据的预测能力。
本文主要是基于变精度粗糙集模型,对信息系统的属性约简算法进行研究。全文共分五章,第一章绪论主要介绍粗糙集理论的发展和特点,以及它研究的主要问题。第二章介绍标准粗糙集模型、信息系统、属性约简以及变精度粗糙集模型的基本概念。第三章主要是讨论变精度粗糙集所有约简及其参数范围的确定,并给出相应的算法,通过实例说明所给算法的有效性和可行性。第四章主要从属性依赖度增量、互信息增量、基于覆盖度与准确度的度量等角度分析属性重要度,并以此作为启发式信息,给出获得变精度粗糙集最小约简的启发式算法,通过实例说明算法的有效性和实用性。第五章是在分析贝叶斯粗糙集模型的基础上,将只含有两个决策类的贝叶斯粗糙集推广成含有多个决策类的情况,给出相关定义和简单性质,从全局相对增益的角度对属性重要度进行分析,在此基础上给出贝叶斯粗糙集属性约简的启发式算法,且相应的算法应用MATLAB程序进行实现。通过实例将贝叶斯粗糙集属性约简与变精度粗糙集属性约简的结果进行比较,说明所给出贝叶斯粗糙集算法的有效性及可行性。