基于用户搜索历史的个性化信息检索研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：peterqiu123

【摘要】

：

个性化信息检索针对用户个人兴趣偏好优化文档排序,被认为是现有搜索引擎改善用户检索体验的一种有效途径。个性化信息检索以用户为中心提供有针对性的检索结果,因此不仅考虑

【作者】

：

王晓春

【出处】

：

哈尔滨工业大学

【发表日期】

：

2015年期

【关键词】

：

个性化信息检索用户历史查询模型增量层次聚类长短期历史融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

个性化信息检索针对用户个人兴趣偏好优化文档排序,被认为是现有搜索引擎改善用户检索体验的一种有效途径。个性化信息检索以用户为中心提供有针对性的检索结果,因此不仅考虑查询和文档的匹配度,还考虑文档和用户兴趣偏好的匹配度。用户历史包含用户丰富的信息,是获取用户兴趣偏好的最佳途径,成为个性化信息检索研究的焦点。为了探索不同的用户历史在检索中的作用,本文量化分析了用户历史与检索结果的相关性,探讨了如何利用短期历史、长期历史、以及综合利用二者以提高个性化检索性能的方法。1)针对用户历史与检索结果的关系,量化分析了用户长短期历史与用户查询和点击的相关性。本文采用向量空间模型框架,从以下四个方面分析了用户长短期历史与查询和点击的关系:相关比例、相关程度、是否存在线性关系和具体内容上的差异。分析发现79.55%的查询可以从用户历史中获取相关信息,其中短期历史覆盖的比例较大(71.23%),相关程度也较高;而针对同一个查询,不同的用户历史所提供的相关信息不尽相同,彼此的结合有可能进一步提高检索性能。2)针对如何合理利用短期历史的问题,提出了一种短期历史权重自适应的个性化检索方法。为了合理分配短期历史权重,本文以短期历史和当前查询的相关强度为核心依据,以当前查询、短期历史查询、短期历史点击三个维度上的用户行为特征为线索,建立了SVM回归模型对短期历史的权重进行预测。实验表明,该方法能够根据具体的检索环境为每个查询的短期历史动态分配权重,有效提升了个性化检索性能。3)针对如何有效利用长期历史的问题,本文引入增量层次聚类算法对长期兴趣建模,并在此基础上建立新的查询模型。长期历史内容丰富但主题相对分散,并随着用户的使用不断积累更新,因此长期历史中包含很多与当前查询无关的内容。针对该问题,本文采用增量层次聚类算法渐进地构建用户长期兴趣树,并使用对当前检索有最大帮助的兴趣簇估计长期兴趣模型,从而对用户查询进行有益补充。实验证明,基于长期历史增量层次聚类的个性化检索方法显著优于现有基于长期历史的检索方法,在一定程度上解决了具有多样性和动态性的长期历史的利用问题,改善了个性化检索性能。4)在上述研究的基础上,设计了一种基于用户长短期历史融合的个性化检索框架。用户长短期历史对检索结果的作用不同,本文的模型将二者的不同作用综合作用于查询和文档,一方面根据长短期历史更准确地估计用户查询,另一方面考虑了文档相对于用户的重要性差异。实验中全面比较了不同用户历史的各种组合,结果表明长短期历史融合作用于查询的效果优于只使用一种历史的情况,而同时作用于查询和文档可以获得最佳的检索性能。

其他文献

工程建设机械国际标准的发展和我国的对策

期刊

工程机械国际标准发展中国对策international standard preparationbuilding construction machi

广义保序加密研究

近年来,随着云计算和云存储技术的高速发展与广泛运用,云计算和云存储中的安全问题越来越引起用户的重视。为了保护数据的隐私性,有必要对数据进行加密,但传统加密会阻碍数据

学位

可搜索加密保序加密揭示序关系的加密广义保序加密安全性分析

砼泵主油缸PTFE组合密封圈

砼泵主油缸ＰＴＦＥ组合密封圈湖北建设机械股份公司戚治义随着高压大排量砼泵的兴起，其液压系统出现了高低压切换和利用活塞运行终止、油缸未换向之前的瞬间升高的压力油进行控制液压

期刊

混凝土泵油缸密封圈

塔式起重机钢结构疲劳寿命估算

针对目前大量在用塔械起重机已经工作２０年以上的情况，本文提出了对塔机焊接钢结构进行疲劳寿命的估算的方法。首先通过试验获得寿命估算部位的Ｐ－Ｓ－Ｎ曲线；同时通过采样统计出该部位的应

期刊

塔式起重机钢结构疲劳寿命

论国际商事仲裁协议的有效性

[摘要] 在国际商事仲裁制度体系中，有效的国际商事仲裁协议方能构成进行国际商事仲裁的前提。在分析国际商事仲裁协议有效性的要件的基础上，结合我国现行立法的规定，当可获得对该问题的清晰认识。　　[关键词] 国际商事仲裁协议有效性　　　　一、国际商事仲裁协议有效性的要件　　国际商事仲裁协议，是国际商事交往中的双方当事人自愿把他们之间已经发生或者将来可能发生的财产性权益争议提交仲裁解决的协议。只有满足

期刊

国际商事仲裁协议有效性

塔式起重机结构扭转振动分析的有限元方法

研究了用有限元法计算塔式起重机扭转振动的计算模型，结构矩阵分析的计算方法，提出了回转动力系数的概念。

期刊

激振荷载扭转振动塔式起重机有限元法

教育转型时期教研组建设的坚守与突破

教研组的建设直接关系到学校教育教学质量的提升,关系到学校教师的专业成长,关系到学校的生存与发展。教育转型时期,学校教育面临转型性变革,同样教研组建设有必要在坚持服务

期刊

转型教研组建设服务共同体机制

混凝土泵斜置式闸板分配阀特点

在近一个世纪漫长的混凝土泵技术发展过程中，各种型式的混凝土分配阀在不同时期内竞相发展。闸板式混凝土分配阀作为其中的一种，从６０年代中期由Ｓｃｈｗｉｎｇ公司研制成功的平置式闸板阀，到ＩＨＩ公司

期刊

混凝土泵闸板式分配阀

高质量动态四边网格序列生成算法研究

近年来,随着信息技术的不断发展,大量的三维扫描和重建技术不断涌现,人们已有能力获取三维模型的实时动态数据。将这些技术应用在计算机游戏和动画领域,可以比较方便地获得由

学位

四边网格序列交叉场全局优化对称

私募股权投资特征会影响其减持行为吗

基于2006—2011年沪深两市首次公开上市并有私募股权投资参与的A股公司为研究对象,从私募股权投资的特征角度对我国私募股权投资在锁定期解禁后的减持行为进行了研究。研究发

期刊

私募股权投资减持行为投资期限投资背景

基于用户搜索历史的个性化信息检索研究

与本文相关的学术论文