论文部分内容阅读
传统的信息组织方式以人类用户的阅读习惯进行设计,使得检索结果不能够精确定位到用户的需求,因此语义网(SemanticWeb)和本体(ontology)技术逐渐发展起来,成为当前信息检索领域研究的热点。语义网用一种机器容易处理的方式组织信息,它具备更好的灵活性、集成性、自动性和自适应性,尤其是本体技术的应用,使语义网更加智能化,在知识组织和服务中本体技术也得到了广泛的应用。围绕着语义网的建设和应用,出现了各种工具和实验性应用项目。与此同时国际语义网联盟(W3C)也推出了面向语义检索的标准查询语言SPARQL,用来完成对本体的各种检索。但SPARQL不是自然语言,需要了解本体知识库的组织方式并学会用SPARQL的语法来表达自己的查询意图,这种方式为普通用户带来了不便,为此笔者提出了一种较为理想的方式是:用户只需用自然语言来表达自己的查询意图,系统自动完成问题到SPARQL的转换和概念推理并执行相应的查询,返回查询结果。
本文首先分析了传统信息检索手段的不足,简要地介绍了语义检索的实现的背景,结合知识组织介绍了本体的概念,分析了本体的优势及SPARQL检索本体的方式。接下来,对问题进行分析和归类,提出一种中文自然语言问句到SPARQL语言的转化方案,随后,讨论了本体推理规则的描述,并利用Protege提供的推理引擎接口,调用Jess推理机完成本体概念的推理,提出了语义检索的模型和推理相关的算法,进而设计、实现了系统的语义检索和推理功能。最后通过特定的领域本体建立知识库,对系统进行测试,其查准率和查全率比传统方法有明显提高。
在本文的研究和开发过程中参照了语义网的体系构架,围绕知识服务中的各种理论和技术,综合利用了自然语言处理、本体构建、本体检索,推理技术等各方面的知识,并将这些理论通过本文提出的语义检索模型整合起来,在一定程度上解决目前信息检索系统中语义的处理不足,是语义网理念和本体应用技术在中文信息检索方面的一次有益尝试,为进一步的应用提供基础和参考。