论文部分内容阅读
粗糙集理论( Rough Set Theory, 简称RST )是由波兰学者Z. Pawlak于1982年提出的一种处理含糊和不确定性问题的新型数学工具。RST的处理对象为具有离散属性值的完备信息系统(Complete Information System, 简称CIS), 但是在现实世界中由于各种原因,面临的信息系统往往是不完备的,因此研究如何使用RST处理不完备信息系统(Incomplete Information System, 简称IIS)对于RST的发展起着举足轻重的作用。
为了避免损害到数据的原有分布特征,本文采用直接方式处理IIS, 即将传统RST中的不可分辨关系进行弱化,对粗集理论进行扩充。本文首先对现有的几种扩展粗集模型进行了分析比较,主要有基于容差关系的扩展粗集模型、基于非对称相似关系的扩展粗集模型、基于限制容差关系的扩展粗集模型、基于变精度限制容差关系的扩展粗集模型、基于集对容差关系的扩展粗集模型和基于变精度集对容差关系的扩展粗集模型。
要进行知识约简与知识推理,就必须要研究知识之间的依赖关系,所以本文接着分别给出了在以上几种扩展粗集模型中对象依赖和属性依赖的定义,并且给出了对象部分依赖、属性部分依赖的定义及其度量。从这些定义中,得出一些相应的性质和定理,说明完备信息系统中的部分性质在不完备信息系统中依然成立。
知识约简是粗集理论的核心内容之一。在各种扩展粗集模型中,提出统一的以对象依赖或属性依赖为依据,进行对象约简或者属性约简的方法,并给出了相应的算法。
最后将这种以依赖度为约简依据的方法应用于不完备数据表和不完备决策表两个实例,在不同扩展粗集模型中进行约简,得到了很好的约简效果,从而验证了该方法的正确性和有效性。