论文部分内容阅读
形式概念分析是德国的Wille教授在20世纪80年代提出的,随着对该理论研究的不断深入,利用形式概念分析理论进行数据库中的知识发现研究已经成为当前计算机科学领域的一个热门研究课题,本文主要研究了这一课题。概念格也称为Galois格,是形式概念分析理论中的核心数据结构,它具体而形象地描述了概念间的大小次序关系,是一种重要的知识表示结构。本文也对概念集合的计算算法和概念格的构造与其hasse图的绘制算法进行了研究。取得的创新性研究成果如下:
(1)基于形式概念的概念外延集合在闭包操作交下是闭包系统的这一性质,提出了一种高效快捷地生成输入背景相应的概念集合的算法。
(2)提出了概念间的有向上界可达矩阵结构,利用该结构可以高效快捷地判断和存储各形式概念间的覆盖关系,进而构造出概念格结构。利用该结构的算法根据概念间格序从大到小的关系(即各概念外延势的大小关系)从顶层元素到底层元素按广度优先分层绘制出表示概念的结点,在绘制当前层每个概念结点的同时利用概念间的有向上界可达矩阵结构判断出并绘制出当前结点与其父概念结点连接的边,进而最终绘制出相应概念格的hasse图。
(3)在事务数据库中的知识发现领域,发现条件属性和分类属性之间的蕴涵关系,即分类规则挖掘,是一个热门课题而且有实际应用价值。论文首先介绍了相干概念的定义及与其相关的概念,再提出了一种求背景的相干概念覆盖的增量算法,然后对背景进行相干概念覆盖的划分,基于相干概念覆盖结构提出了一种分类规则挖掘的算法。相干概念覆盖结构有两个主要的好处,它能表示出所有的形式背景(数据集合)而不丢失信息,并且它能表示出全部的格而没有概念冗余,因此本方法很大程度地消除了规则冗余,能高效且低冗余地进行分类规则的归纳挖掘。