基于用户行为与本体的查询词扩展研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:youling0186
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息检索技术中,查询词扩展是一种能够有效提高查询效率的技术。因此,通过充分发挥查询词扩展技术的优越性可以大大提高搜索引擎在搜索精确度方面的效率。查询词扩展技术通过将与用户查询词相近、相关的词扩展到用户查询词中的方法,更准确地描述用户的信息需求,去除用户查询词的多义性,从而更精确地查询用户所需信息。为了更好地实现查询词扩展,解决传统查询词扩展技术缺少智能性以及主题性差的问题,结合形式概念分析与用户行为(搜索日志)、本体(Ontology)进行查询词扩展,可以综合三者的优点,形成一套基于形式概念分析、用户行为、本体的查询词扩展方法,从而提高搜索引擎的查询准确率。本文的主要研究内容归纳如下:1.提出了一种基于用户搜索行为的查询词扩展源的抽取方法。分析用户的搜索历史和点击网页历史以及他们之间的潜在相关性,同时考虑搜索返回网页顺序和用户点击网页顺序,从网页中抽取出能表达用户搜索意图、用户兴趣的相关词作为查询扩展词,将网页和抽取出的查询扩展词分别作为概念的对象和属性并构造概念格,将其作为查询词扩展源。实验表明使用本文方法抽取的查询词扩展源优于使用传统方法抽取的扩展源。2.提出一种构建用户本体的方法。从WordNet中抽取出查询词与查询扩展源的相等、相似、ISA、partof等语义关系,利用本体的构建方法,把查询词、查询词扩展源以及它们之间的语义构建成用户本体。3.提出了一种基于本体的查询词扩展方法。利用本体的相似、相等、上义、下义和PartOf语义关系,提出一个基于本体的查询词与概念相似度计算的新方法。通过这种查询词与概念相似度的量化,可以很好的找到与查询词最相关概念进行查询词扩展,从而提高用户搜索准确率。实验通过把本文方法的查询词扩展结果与目前其它方法的查询词扩展结果对比,表明了本文提出的方法是具有可行性的。
其他文献
随着Internet的高速发展,计算机技术也进入了以网络为中心的发展时期。网络服务正朝着高效率,低响应时间,高吞吐量的方向发展。人们对高效率和高可靠性的追求,给应用服务器带
随着互联网技术的发展,网络已经对人们表达自己和与他人互动的方式产生了巨大的影响。在线评论在今天的电子商务中起到至关重要的作用,消费者常常会通过网络查看商品或者商店
决策树算法在数据挖掘技术中有重要的作用,本文着重研究了决策树理论中的C4.5算法,针对其在当训练集样本包含大量的连续值属性时,算法将会效率低下的缺点,提出了利用划分熵取
在日常生活中,不规则物体是一类比较特殊的物体,它们没有固定的外观形状,人们可以很容易的指认这些物体,却总是不能准确地给出这些物体的统一定义,因此不规则物体模拟是计算
病历信息是医疗过程的记录,是医护人员进行医疗活动的客观依据。随着医院信息化的不断发展,病历正逐步从传统的纸质病历过渡到电子病历。电子病历具有超越纸质病历的许多优点
随着电子商务的快速发展和微博、微信等的崛起,互联网上的短文本评论呈指数形式地增长,这些评论信息的背后蕴藏着巨大的经济和社会价值。传统的手工处理方法变得越来越困难,
学位
软件即服务是一种最近兴起的软件模式。它将服务的概念融入传统软件模式之中,客户先试用再购买其所需的服务,降低了软件费用。由于其按需付费、方便快捷的升级维护和低费用等
随着软件的需求和规模的增大,软件的质量变得日益重要。软件测试是软件质量的最重要解决方案,而测试用例的生成则是软件测试中最重要的环节。由于测试用例生成的效率和方法将
近年来软件开发在需求分析阶段的高失败率,使得包括需求获取和需求分析在内的软件需求工程成为当前软件工程领域研究的热点。而作为软件开发周期中的关键技术,需求工程技术的研