论文部分内容阅读
粗糙集理论是八十年代初由波兰学者Z.Pawlak提出的一个数据分析的有力工具,近年来日益受到各领域的广泛关注,并已在机器学习、模式识别、决策分析、过程控制、数据库知识发现、专家系统等领域得到了成功的应用。研究基于粗糙集理论的知识获取方法有着重要的意义。 本文基于粗糙集理论,对信息系统中的一些知识获取方法进行了研究,并取得了以下研究成果: 在信息系统的决策规则获取方面,针对协调决策表提出了一种基于正向近似的决策规则挖掘算法。实例表明该算法简单有效。这些结果将有助于基于粗糙集的知识发现研究。 在不完备信息系统不可区分性的度量方面,将多值信息系统与含有缺省值的不完备信息系统统一起来,借鉴信息系统中知识粒度与信息熵的思想,针对含有缺省数据或不精确数据(即含有缺省值或多值)的不完备信息系统,定义了系统的不可区分度与可区分度,并讨论了二者的性质,建立了二者之间的关系,并且证实了不完备信息系统的不可区分度与可区分度可退化为完备信息系统的知识粒度与信息熵。这些结果为研究信息系统不可区分性的度量提供了新的角度。 在不完备信息系统(含有缺省数据或不精确数据)的属性约简方面,针对不完备信息表,基于系统的可区分度给出了属性重要性度量,并提出了一种基于可区分度的属性约简启发式算法;针对不完备决策表,基于条件可区分度给出了属性重要性度量,并提出了一种基于条件可区分度的属性约简启发式算法。实例表明,上述算法能得到不完备信息表的约简和不完备决策表的相对约简。这些结果对研究不完备信息系统中的