论文部分内容阅读
在互联网如此发达的时代,查询搜索已经成为人们获取知识最主要的途径。传统的搜索引擎大多基于关键词匹配,而在2012年,知识图谱的提出改变了传统的搜索引擎模式,搜索引擎可以智能化的“理解”用户输入的自然语言,并返回最相关的知识给用户。然而目前知识图谱技术基本都还是用于开放性领域的开放性知识,每个特定领域的知识库中的知识依然存在着知识间信息孤岛、知识间的联系没有建立,知识的管理维护不规范,知识的更新和组织困难等问题。因此,如何合理组织领域知识建立领域知识库,给相关领域用户提供高质量的服务成为目前急需解决的问题。针对以上问题,本文采用知识图谱的形式组织领域知识,提出了建立领域知识库的解决方案,并完成了相应的领域知识库管理系统的设计与实现。主要研究内容有:(1)知识图谱的构建。主要包括图谱中节点和边提取所对应的命名实体提取和实体关系抽取。(2)知识库管理系统的设计。包括系统的架构设计,功能模块设计,模块间的交互设计,数据存储结构和存储方式的设计等。(3)知识库管理系统的实现。主要包括知识存储,知识更新和查询检索等功能模块的实现。知识的存储模块综合采用了 Neo4j,Mysql和ElasticSearch等多种数据库。知识的更新模块通过收集用户查询日志并做聚类分析实现领域知识库的半自动化更新。知识的查询检索模块结合图检索和ElasticSearch开箱即用的全文检索功能进行实现。本系统提供了基于知识图谱建立领域知识库的一站式解决方案,实现了领域知识库基本的管理和维护功能,同时使知识库具备一定的智能型和灵活性。根据对上述内容的研究,本文选用适用于领域知识特点的相关工具和技术构建了基于知识图谱的领域知识库管理系统。解决了领域知识库中的信息孤岛的问题,建立了知识本体间的多样性关联,用知识图谱的形式组织和管理知识库中的知识。大大减少了领域专家维护管理知识库的重复劳动力,提高了领域用户获取领域知识的方便性和灵活性,验证了知识图谱相关技术对领域知识库的可用性。