论文部分内容阅读
传统的搜索引擎在进行搜索时会带来一些问题,比如查询信息过多或者不容易找到查询的相关信息等,解决这一问题的有效方法是研究智能搜索引擎,进行智能化查询。由于形式概念分析中的概念格有良好的数学性质、适合批处理和能表示概念之间的关系等特点,我们认为概念格模型是解决搜索引擎进行智能搜索问题时的一种非常理想的工具。考虑到需要处理大量的数据,我们应用了分布式概念格模型。本文的目的也就是分析概念格的数学模型,研究其数学性质,对概念格的构造算法进行探讨,为概念格的分布式存储和并行运算提供理论基础,从而进一步将概念格应用于智能搜索引擎。 本文内容如下: (1)介绍了传统搜索引擎的缺陷,以及引入智能搜索引擎的必要性和可行性,并且认为可以将概念格模型应用于智能搜索引擎的开发。 (2)介绍了概念格的数学基础,包括与概念格模型相关的序论和格论中的一些定义。给出了两类概念格的建造算法,即批处理算法和渐进式构造算法,并就经典的批处理算法如Bordat, Chein算法,经典的渐进式构造算法如Godin算法做了详细介绍,而且给出了改进的Godin算法。 (3)给出了分布式概念格的数学模型,重点讨论了在分布式概念格的数学模型下,外延独立的两个同域概念格的并运算,研究高效的合并两个同域概念格的算法。并对概念格的算法级并行构造作了介绍,介绍了并行计算的特点与现状,并详细分析了一种并行构造算法。 (4)就如何从不同的数据源中抽取出形式背景作了简单的探讨,主要对关系数据表和XML两种类型的数据来抽取形式背景,详细介绍了关系型数据和XML类型的数据的形式背景抽取方法。 (5)针对基于FCA的智能搜索引擎作了探讨,分析搜索引擎的特点以及智能