论文部分内容阅读
粗糙集理论是处理不完备信息的一种方法,它是建立在这样一种假设[3] 下即:对论域中的每个对象总是有一些信息是相互联系的,并且对象仅由能够较容易获得的有效信息来描述。因此对于具有相同信息的不同对象可以将其看作在已 知的信息中是不可区分[1] [3] [16] 的,所以有效信息可以用等价关系来表述,称之为不可区分关系,其中每个等价类由不可区分的对象组成。汪培庄教授于80年代初提出因素空间[26] [28] ,1982年他正式发表了有关因素空间的论文。现代控制论中的状态空间,模式识别中的特征空间和参数空间,现代物理中的相空间等都是因素空间的特殊情形。粗糙集理论和因素空间在各个方面有着广泛的应用,由于粗糙集理论将等价关系对空间的划分与知识等同,即将知识理解为对数据的划分,任何U的子集称为U中的一个概念或范畴。粗糙集的研究对象[15] [18] 是由一个多值属性(特征、症状、特性等)集合描述的一个对象(观察、病历等)集合,对于每个对象及其属性都有一个值作为其描述符号,对象、属性和描述符是表达决策问题的3个基本要素。这种表达形式也可以看成为一个二维表格,表格的行与对象相对应,列对应于对象的属性:各行包含了表示相应对象信息的描述符,还有关于各个对象的类别成员的信息。于是形成了粗糙集理论的知识库[16] [18] ,而因素空间理论的因素空间与知识库之间具有一定的关系,我们在本文中讨论了二者之间的关系。另外,由于知识的不完备,我们在进行知识获取[18] 之前需要对数据进行预处理,包括原始数据的采样、收集和整理。但是,我们获得的原始数据不一定适合直接用于知识获取,通常还要进行预处理加工,对于原始数据资料中遗漏的信息,需要补充。对遗漏信息进行补充的方法有多种,本文提出了一种基于决策的数据补全方法,并举例说明其有效性。