个性化信息检索中用户兴趣模型的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:Michellesy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
下一代搜索引擎的一个突出特点是个性化,个性化信息检索是以用户为中心的信息检索技术,它获取以多种形式表达的用户需求(包括显式的、隐式的以及相关用户的需求),并综合利用这些用户信息,提高信息检索系统的性能。作为个性化信息检索中的重要研究子课题,用户兴趣模型研究通过对用户检索和浏览历史的分析,建立用户短期与长期兴趣模型,并随着用户信息和检索领域的变化对用户兴趣模型进行更新。用户兴趣模型研究面临的主要问题是,缺乏合理的任务划分和标准评测集,无法对用户兴趣模型进行公正的评价。因此,本文通过对个性化检索进行合理的任务划分,并利用开发的语料标注辅助系统,为其建立了标准评测集,以公正地评价和比较用户兴趣模型。个性化信息检索可以根据用户的检索兴趣返回个性化检索结果。本文首先提出了用户短期兴趣模型,根据用户检索对象的变化识别包含新检索兴趣的查询。同时,引入TextTiling方法并对其进行改进,使系统可以自动选择合适的动态阈值并准确发现用户检索兴趣的转移。在本文构建的标准评测集上的实验结果表明,改进的TextTiling方法使得用户新兴趣发现系统性能提高了16.4%,而且使得最终的个性化信息检索系统的性能提高了3.8%。本文同时还提出用户长期兴趣模型,采用余弦相似度法和迭代法确定各个用户单一模型的权重,将单一模型合并为用户长期兴趣模型。在本文构建的基于TDT语料的标准评测集上的实验表明,基于余弦相似度法和迭代法的用户长期兴趣模型使系统性能提高了7.3%,并使得最终的个性化信息检索系统在用户短期兴趣模型的基础上提高了8.2%。
其他文献
随着信息技术的迅速发展和Internet的日益普及,数字图像、音频、视频等数字媒体已经成为信息交流的重要方式,人们可以轻松地通过Internet获取和传播各种数字作品。数字媒体给
Web Services作为一种新的应用模式及远程访问标准,很好地解决了异构平台上数据的应用和整合。它利用开放标准(WSDL,UDDI,SOAP)把不同组织开发的软件实体以服务的形式加以使
数字水印技术是知识产权保护和安全隐秘通信的重要手段之一。视频水印是数字水印技术的重要分支,视频联合工作组(JVT)为实现视频的高压缩比、高图像质量、良好的网络适应性,提
粗糙集理论是一种新型处理含糊和不确定性知识的数学工具,自提出以来在众多领域得到成功应用。动态约简作为一种有效的属性约简方法,现有研究已证明其理论优越性,然而计算复
讯问过程中的同步录音录像,是检察机关顺应刑事司法现代化趋势,完善讯问的程序设计以求更好地实现司法公正和保障人权而推出的一项重大举措。作为一种最直接也最直观的证据资
随着移动数据通信技术和Internet之间融合地越来越紧密,整个世界正在快速地向移动信息社会演变。人们已不再满足于传统的局限在有限空间里的信息存取方式,而希望将活动的地点
目前,为企业业务流程提供建模、管理和集成、仿真分析与优化的工作流管理技术受到了广泛的关注和应用。但是,很少有工作流产品为建模人员提供全面的工作流仿真分析功能来验证
煤矿开采过程中,由于自然环境因素复杂多变,对井下灾害进行事前安全预警较为困难。针对该问题,本文研究利用多传感器数据融合技术对井下安全状态预警的方法。论文对现有多传
在西方医学蓬勃发展的今天,祖国医学也在慢慢的走向世界。尤其是祖国医学的无创伤性的诊断方式越来越受到人们的关注与认可。面部的颜色是“望诊”中待考察的非常重要的特征
随着Web应用广泛进入教育、银行、航空、电子商务等领域,系统的规模急剧扩大,业务逻辑和流程变得复杂,Web功能测试的作用也显得越来越重要。面对系统规模的增大及复杂性的提