论文部分内容阅读
语义网是W3C提出的一种智能网络的设想,其目的在于使机器能够理解词语和概念,网络上的语义网数据多以开放链接数据集的形式发布。在开放链接数据的基础上,人们使用知识库存储知识,开发各种智能应用。但是现有的知识库管理方案,多数是像传统数据库一样对数据进行简单的增改删查,并不能完善地支持语义网标准,并且缺乏管理模式知识、处理语义关系的能力。本文的目的是设计和实现一种面向开放链接数据的知识库管理系统,为知识工程以及各种知识库应用提供一种有效的知识存储和管理方案。该系统面向结构化和非结构化的开放链接数据,用图数据库Neo4J作为本体数据库,用Virtuoso作为底层RDF数据库,分离存储链接数据的模式层和数据层,提供本体库的自动化管理服务,支持SPARQL、语义查询等多种查询方式。深入分析语义网技术标准和本体工程的一般问题后,本文在现有知识库存储方案和语义网框架的基础上完成了以下工作:一、总结知识库管理所面临的五类场景需求,根据知识库管理的实际需要提出了面向开放链接数据的知识库管理系统。二、本文将知识库管理系统分为解析层、模型层、存储层、查询层和应用层五个层次,设计了知识存储、知识抽取、多类型查询引擎、本体算法组件等功能模块。三、文章阐述了系统中多项关键技术的研究和实现过程。首先基于Jena设计了支持图存储结构的数据类型,对RDF数据模型和本体建模,在此基础上实现了结构化和非结构化链接数据的解析器/读写器。然后本文总结了自动化本体管理的核心问题,以概念和概念层次结构为基础,提出综合相似性度量用于本体搜索,并使用有监督学习分类器和WordNet词典系统实现了本体映射和合并算法。同时还基于依存分析完成语义查询的解析,设计了多类型查询引擎的查询语言转换流程。四、最后对知识库管理系统进行了一系列功能测试,验证了系统功能模块的可用性,并使用BSBM等测试数据集检验了系统性能。本文的研究成果是提出了一种知识库管理的新方案,明确了知识库管理的需求和功能设计,并实现了可用的知识库管理系统,为知识工程的发展和创新提供了新的思路。其创新点在于实现了知识库模式层和数据层的分离管理,使用自动化的本体搜索、映射、合并算法减少了本体管理的人力成本,并提供了多类型的知识查询方式。