论文部分内容阅读
随着Internet技术的不断发展及其应用的深入,Web俨然已经变成全球最大的虚拟资料库,可用的信息正呈指数级的增长。对于一个普通的用户,面对信息的海洋,要检索出所需要的文档变得越来越难。目前的Web信息检索系统大多是基于关键字匹配的搜索引擎技术,没有考虑到对检索关键词进行语义上的分析和处理,不能充分挖掘出用户的检索意图。并且,不同领域背景、知识结构的用户对文档相关性的判断也是不同的。Web信息检索技术应提供智能化、个性化、专业化的服务,才能更好地满足用户从Internet上有效获取信息资源的要求。
本体(ontology)是描述概念及概念之间关系的概念模型,通过概念之间的关系来描述概念的语义。由于本体具有良好的概念层次结构,因而在信息检索中得到了广泛的应用。本文首先对本体的相关理论进行了深入研究,探讨本体在智能信息检索中的应用。接着使用W3C的RDF/RDFS技术构建了领域本体,提出了一种计算本体语义相关度的方法,在信息检索领域,利用语义相关度的计算方法,量化了概念之间的关系,可以使用查询关键字扩充和修正技术,通过和用户的交互,改进查询的准确度。在此基础上,本文设计并实现了一个基于领域本体的个性化智能信息检索系统——OntoHelper,这个系统工作在客户端,利用计算本体概念相关度的方法,对检索关键词进行语义上的分析和处理,能够用来提高用户检索时的联想能力和精确性,系统采用了元搜索引擎的工作方式,同时对用户的兴趣偏好进行建模,综合使用“搜索引擎信任度评级”和“个性化评级”的计算方法来对检索页面进行排序。
与传统的搜索引擎方式相比,OntoHelper系统具有智能程度高和针对性强的特点,在信息检索时既满足了信息的广度需求又适应了用户个性化需求,适合于成为个人Web信息检索助手,有着很好的实际应用价值。