论文部分内容阅读
语义Web是一个具有丰富语义的数据网络,它通过语义Web标准、标记语言和处理工具对现有Web进行了扩展,使计算机可以更好地与用户协同工作。在语义Web的层次结构中,本体处于中心位置。作为一种概念建模工具,本体在语义Web、信息检索、模式识别、自然语言理解和知识工程等领域得到了广泛应用。 领域本体为领域知识的理解提供了一个模型,它使机器对语义的理解具备一致性,从而使计算机与用户能够更加顺畅地交流。领域本体不仅加强了语义信息的表达能力,而且具备可共享性和可重用性,这些特点使它被广泛应用于多方面的研究当中。本体是实现语义Web的关键,而构建出一个尽可能全面的、具备较强推理能力的本体是使用本体的首要前提。 构建本体需要概念、关系、规则等数据,具有实用性的本体通常数据量非常庞大。特别是对于复杂领域或大领域而言,如果采用人工构建的方法,不仅概念不易获取,而且概念关系错综复杂,构建过程工作量巨大。因此,本体的半自动或自动化构建越来越受到研究者的重视。 本文研究了一种针对复杂领域的半自动本体构建方法。结合模糊形式概念分析(FFCA)、WordNet和英文维基百科提出了基于多概念格的复杂领域本体构建方法和模型。此构建过程先将收集到的领域文档进行归类,然后构建多个模糊概念格,最终将其转化为一个完整的本体。首先,利用关键词搜索并收集领域文档,利用维基百科对文档进行归类以划分子领域;然后,对每个子领域构建形式背景并生成概念格,再将它们连接成一个整体概念层次结构;最后在概念格表示的概念层次中添加模糊信息,并通过本体映射将其转化为初始模糊本体。 本文采用上述方法设计出了复杂领域本体构建的总体框架和模型,并以软件工程领域为例进行验证,构建出了领域本体,证实了基于多概念格本体构建方法的可用性并讨论了其特点。文中所描述的构建过程针对于复杂领域,构建出的本体概念、关系等结构清晰,很大程度上克服了复杂领域概念关系庞大而杂乱的弊端,本体的规模也能够得到有效控制;本体中含有模糊信息,语义更加丰富;本文的方法能够大大提高构建效率,且概念、关系更加全面。