论文部分内容阅读
概念格是一种新兴的基于概念的知识表示模型,是形式概念分析的核心数据结构。形式概念分析强调以人的认知为中心,提供了一种与传统的、统计的数据分析和知识表示完全不同的方法,成为了人工智能学科的重要研究对象,在机器学习、数据挖掘、信息检索等领域得到了广泛的应用。本文围绕概念格构造与应用中的关键技术展开研究,这些研究将会对概念格的应用起到积极的推动作用。本文的主要创新点和研究内容包括:(1)概念格的渐进式构造。证明了概念的生成及其插入位置只与最新生成的概念有关,与先前生成的大量概念无关。设计算法编写程序,运行结果表明:在形式背景中插入对象时,概念格中增加的新生概念数量较少,且不随概念格规模的增大而迅速增大。(2)概念格的合并。子形式背景可以进行纵向或横向合并得到一个新的形式背景,相反地,这个形式背景可以进行纵向或横向的拆分得到子形式背景。相应地,子概念格也可以进行合并,得到一个新的概念格。概念格合并无论是纵向合并还是横向合并,合并都不改变原有概念之间业已存在的父子关系。根据这个事实,结合概念格合并的定义,设计了概念格合并算法。这个算法充分利用原有子概念格的结构,与将一子概念格中的概念插入到另一子概念格相比,实验和分析均证明效率明显提高,适合概念格的合并运算。(3)概念格的维护。将把形式背景的变化分为对象-属性关系的增加和删除、对象或属性的增加和删除两类,然后分别研究了这两类变化引起的概念格的维护问题。在对象-属性关系的增加引起的概念格维护中,提出了父子概念对的概念,用来确定概念格维护的位置以及概念之间关系的调整。在对象-属性关系的删除引起的概念格维护中,提出确定概念格维护位置后用父子概念对代替被维护的概念,对父子概念对中的冗余概念进行判别并对父子概念对进行更新。在对象或属性的删除引起的概念格维护中,提出了利用唯一路径上的关键概念来调整因为概念的删除引起的概念之间关系的变动。另外,研究了概念格中概念缺失引起的维护问题,并提出利用概念格的完全格特性进行概念格的维护。(4)概念格上的关联规则提取及维护。论述了概念格上的偏序关系、内涵缩减与关联规则提取,证明了属性纯化形式背景上的关联规则与其补上的关联规则互逆。对概念格上的关联规则渐进式提取进行了研究,包括基于对象、基于属性和基于关系三个部分,根据概念格的渐进式构造引起的变化分析了概念内涵缩减的变化,提出并证明了内涵缩减的更新规律。作为概念格上的关联规则渐进式提取的逆过程,研究了概念格上对象、属性、关系的删除引起的关联规则更新,在分析两个过程概念对应关系的基础上直接用定理的形式给出了内涵缩减的更新规律。利用基于属性的关联规则渐进式提取的理论成果,提出了基于概念格的决策表规则提取方法,即首先建立条件属性概念格,然后加入决策属性建立条件属性与决策属性的联系,利用概念格的内涵缩减提取决策规则。综上所述,本文对概念格构造与应用中的关键技术进行了深入研究,取得了一定的研究成果。这些成果的应用及其在概念格扩展模型中的推广有着非常好的前景和价值。