论文部分内容阅读
随着人们对互联网信息检索要求的不断提高,传统的基于检索关键词字符匹配的搜索技术已不能满足人们的需求,由于这种单纯的字符匹配技术忽视了关键词本身所含的语义信息,使得传统的搜索引擎在信息的查全率和查准率上一直没有很好的突破。目前利用语义网技术在解决智能搜索方面取得了很多成果,但由于语义网涉及技术的复杂性和应用时的性能等诸多问题使得目前互联网上几乎还没有成熟的基于语义的信息检索工具,这方面也是目前研究的一个热点,因此研究如何在现有条件下利用传统信息检索技术和语义网技术提高Web检索系统的查询效率和性能具有一定的理论意义和实际应用意义。本文对目前的搜索引擎系统以及语义检索系统的实践和研究成果进行了分析和研究,在分析传统搜索引擎和语义网各自具体技术所具有的优缺点的基础上,提出一种基于分类语义的Web信息检索系统,该系统侧重于通过适当简化语义分析和推理,同时利用多种方式获取关于Web文本在主要概念类别方面的语义信息,将智能检索技术融入到传统的信息检索方式中,在一定程度上保证了信息检索系统能够在保证检索性能的前提下提高检索的查准率和查全率。最后,本文根据系统设计做了相应开发和测试实验,分析了不同检索方式对于系统查全率和查准率的影响,同时指出了系统将要扩展的研究内容和方向。