论文部分内容阅读
概念格是形式概念分析所用到的核心数据结构,已经越来越广泛地被应用到人工智能或者是数据分析等诸多领域之中。而一般的形式概念分析是基于精确的形式背景,但是在现实世界中,由于事物的复杂性与多样性,使人们对于事物的认识,对概念的定义很难用精确的数据来进行表示。所以,为了是形式概念分析能够更加广泛的被应用到各个研究领域当中,一些学者们将模糊集的理论和模糊逻辑,以及经典概念格理论(精确概念格理论)这三个研究方向相结合,从而提出了模糊形式概念分析与模糊概念格理论这一个新的研究方向,同时模糊概念格的构造问题就成为了学者们研究的首要课题。根据概念格的数据结构本身的特点可以得知,当前,如何处理大规模的模糊形式背景,以及如何构造大规模的模糊概念格成了该领域中比较主要问题之一。而德国的学者Radim Belohlavek等人为解决大规模数据生成概念格,简化大型模糊概念格,以及高效地生成模糊概念格等问题,提出了一系列的相关理论与算法。其中提到了因子格的构造,却并未给出完整的因子格的构造算法。本文中为了完善模糊概念格因子格的构造算法,提出了基于模糊概念相似性的模糊概念格因子格构造算法。首先,文中对模糊概念格的相关研究背景加以概括,同时对模糊概念格的相关基本概念进行了介绍。然后,对于目前已经提出的模糊概念格的相关构造算法进行了阐述与概括,指出当前模糊概念格构造算法所存在的问题,进而提出本论文的研究方向。接着,本文为了完善模糊因子格的构造,提出了一种基于模糊概念相似性的模糊因子格的构造算法(Factor Lattice Algorithm)。其中,该算法以用户自定义的相似性真值为一个阈值,依据已给出的模糊概念因子格的上确界,采用批处理的方式,根据模糊下邻生成因子自顶向下地计算出模糊概念节点的直接下邻节点的集合,逐步得到完备的模糊因子格。并从理论方面对算法的正确性进行证明,首先证明因子格的上确界所具有的局部最小性,下确界具有局部最大的性质,接着证明在调整相似性的值得同时,概念格的大小也会随之改变,最后对生成格的偏序顺序进行证明。文章的第五部分是从实验的方面证明,算法生成格的完备性,以验证算法的有效性;调整相似性的大小验证算法的正确性。最后一部分提出了算法有待改进的地方,以及下一步的工作方向。