论文部分内容阅读
知识推理是智能决策支持系统中的核心,即根据所获得的信息通过数据分析、推理,从而产生合理的决策规则形成有用知识的过程。粗集理论(Rough Set)作为智能信息处理技术的一个新成果,是由波兰科学家Z.Pawlak教授提出来的对不完整数据进行分析、推理、学习、发现的新方法。根据粗集理论的方法,知识推理就是由给定的知识表达系统的条件属性和结果(决策)属性,求出所有符合该知识的最小决策算法。本文讨论的就是如何将描述事物的本质特征抽取出来的问题,即寻找最小条件属性集和最小决策算法的过程。由RS理论所具有的的特点,我们知道它比原来的模糊集和概率统计方法优越,是处理不精确信息的有力工具。因此研究如何用RS的方法提取本质特征,具有重要的理论和实际意义。本文主要内容如下:首先引入了知识表达系统和决策表,介绍了决策表简化的概念并提出了其简化各阶段相应的算法。其次阐述了基于Rough Set的特征抽取算法的设计原理及实现方法;最后总结了本文的主要成果和不足,并提出了下一步的工作中仍需讨论的问题。本文在基于RS的特征抽取算法的研究方面做了有益的尝试,主要成果包括以下几大部分:一、 提出了决策表条件属性的简约算法及核值表的获取算法;二、提出了决策表规则的简约算法,由该算法可获得所有简化的规则的集合;三、最小决策算法的确定:本文对粗集中属性依赖度的衡量参数k进行了改进,给出了一个新的参数K,更能体现决策属性对某条件属性的依赖程度;四、对于一个通过学习初始训练集而建立好的决策树,新增加的学习例子会不会影响它的稳定性,通过分析,本文中提出了一个是否需要重新建立决策树的判别定理。