论文部分内容阅读
随着网络技术的快速发展和网上信息资源的激增,如何在网上迅速而准确的检索出用户所需资源,成为目前信息检索领域所面临的一个关键问题。传统的信息检索系统主要是基于关键字匹配或基于主题分类进行检索,检索时往往会返回大量无关结果,在查全率和查准率上也均不能令用户满意。
随着本体的广泛应用,人们尝试利用本体中概念之间的关系来提高检索系统的语义能力,因为本体不仅作为一种能够在语义和知识层次上描述信息系统的概念模型建模工具,而且具有良好的概念层次结构和对逻辑推理的支持。在将本体技术融合到传统的信息检索系统之后,检索技术也从目前基于关键词层面提高到基于知识的层面上来。
本文对基于领域本体的语义检索技术进行研究。首先阐述了基于本体的语义检索系统的背景、意义以及国内外研究现状,概述了语义检索和本体的相关概念和理论。接着针对检索所需要的两项关键技术一文档的语义标注和查询扩展进行了深入的研究。在文档的语义标注部分,提出了一种基于领域本体的语义标注改进算法,该算法利用领域本体知识的语义环境和资源文档结构两方面的信息来进行标注。在查询扩展部分也主要是利用领域本体中概念属性关系对用户的查询进行处理,以实现语义上的查询扩展。其次,在以上理论研究的基础上,本文选取100篇服装方面的文档作为实验数据,设计并初步实现了基于服装领域本体的语义检索系统。测试结果表明,该系统在查全率和查准率上都有一定提高。最后,对全文进行总结,并对未来的工作进行了一些展望。