论文部分内容阅读
概念格作为形式概念分析理论中的一种核心数据结构,是近年来获得飞速发展的数据分析的有力工具.在知识发现的过程中建造与应用概念层次结构进行知识获取方面具有很多的优势,而概念格的Hasse图正好体现了一种概念层次结构,因此,研究概念格的基本理论及应用对知识获取有着重要的意义. 本文研究了基于最小生成子的决策规则提取算法(MGA算法)和基于正前件的决策规则提取算法(PPA算法),并取得了一些有意义的结果. 在MGA算法中,首先根据决策背景生成概念格及最小生成子,对包含决策属性的概念内涵的最小生成子进行处理得到决策规则,利用概念格的索引树,可以计算得到规则的支持度和可信度.最后,通过一个医疗数据库对其进行决策规则的提取,从实例可看到该算法是有效的. 在PPA算法中,首先由决策背景生成所有概念,对每个概念内涵的子集判定是否为正前件,从而求得该概念对应的正前件.最后,由正前件生成决策规则集,而该规则集是一个完备的决策规则集. 最后,本文验证了MGA算法和PPA算法的稳定性,论文对两种算法进行分析和比较,通过比较发现,以增加对概念格索引树的遍历为代价,可以使生成的决策规则数大大减少,这一结果对从概念格进行规则提取皆有一定的指导意义.