论文部分内容阅读
粗糙集理论是上个世纪80年代初由波兰学者Z.Pawlak提出的一个用于数据分析的有力的数学工具,近年来日益受到各领域学者,特别是计算机领域的学者的广泛关注,经过二十余年的发展,该理论已经在诸如机器学习、模式识别、决策分析、过程控制、数据库知识发现以及专家系统等领域得到了成功应用。 本文主要围绕不一致信息系统中基于粗糙集的方法进行了探讨,并取得了一些有意义的结果。 在决策表相对属性约简方面,针对在Z.Pawlak粗糙集模型下进行的相对属性约简存在的问题及应用中的困难,分析了变精度粗糙集理论中β下近似约简,将分布约简概念引入到变精度粗糙集模型中,提出了β下近似分布约简概念;另外,借鉴信息熵度量,给出了基于变精度粗糙集模型决策表中属性重要性度量的定义,区分了β阈值界定下的“弱不一致信息”与“强不一致信息”的不确定程度,刻画了标准粗糙集下的正域之外不一致信息的不确定程度;以该度量作为启发式信息,提出了基于信息熵的β下近似分布约简的启发式算法,该算法可以找到一个变精度意义下保持决策分类不变的约简。这些结果为不一致信息系统的属性约简提供了理论依据与应用基础,实例表明该算法针对在不一致信息系统中的属性约简是可行的。 在基于粗糙集的决策规则获取方面,针对不一致信息系统中决策规则获取问题,分析了A.Skowron缺省规则获取算法及其所存在的问题,提出了一种基于粗糙信息向量方法的决策规则挖掘算法。在分析规则可靠性的基础上,引入了规则支持度概念,从而避免了因噪声影响而产生的随机规则;基于粗糙信息向量,利用条件向量对决策向量的决策支持能力,直接从决策表中挖掘出符合阈值要求的尽可能简洁的决策规则,且不损失条件属性值的决策支持能力。利用该算法可以挖掘出决策系统中条件属性在各个简化层次情况下的确定性规则和缺省规则集合。若将该算法挖掘得到的规则集用于决策推理,在待识样本信息不完备的情况下也能给出一个较满意的决策。理论分析和实例表明该算法在不一致信息系统中的决策规则获取上是可行的。