论文部分内容阅读
随着Internet的快速发展,Web已经发展成为全球的信息资源库。如何在海量信息中快速、准确地检索出需要的信息,是信息检索系统需要解决的问题。现有的多数搜索引擎主要是基于关键词的全文检索或是基于网站主题的分类浏览,缺乏语义处理能力,往往导致误检、漏检。造成这种问题的主要原因是:用户期望的结果是结构化的,具有知识性,而Web上的资源是无序的和非结构化的。面对上述存在的问题,提高Web信息的检索质量,寻求新的、智能化的检索方法也就成为了目前信息检索、数据挖掘等研究领域的重要课题。本体是概念的明确的形式化规范说明,从本质上讲,就是某一领域内的概念以及这些概念间关系的集合。可以利用其对用户检索进行扩展、推理,提高检索的精确度,从而把检索提高到语义层面,所以基于本体的信息检索成为一个重要的研究课题。本论文介绍了本体的相关原理及其国内外关于本体的研究现状,使用Protégé构建了一个关于军用飞机领域的实验性本体;分析了经典的信息检索模型,针对传统的基于关键词的信息检索方式存在的问题,利用本体改进现有的经典向量空间模型,提出了一种基于领域本体的语义检索模型,即在建立领域本体术语与文档内容关联关系的基础上,对用户的查询输入预处理,利用本体术语之间的关联关系计算两者的相似程度,给出与查询请求相关的排序后的文档;本文通过设计和实现基于本体的Web智能检索原型系统,初步验证了模型的有效性。本文通过领域本体的构建,为国防领域本体的构建积累了经验和方法,对形成国防领域本体成熟的构建方法论具有一定的探索意义和研究价值。通过实现智能检索原型系统,改进了检索效果,为本体驱动的智能检索的进一步研究打下了坚实的基础。