信息检索中多维度用户相关性的动态研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:chaosmoon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
检索文档的相关性判断是信息检索中的核心问题。同时,用户的相关性判断标准通常被认为是多维度的。在已有的研究中,已经定义和研究了一系列可能影响文档相关性的关键因素,如话题相关性,新颖性,可靠性等。然而,多数现有的工作仍集中在对单独的相关性维度的研究上,而忽略了一个关键的因素,即:用户在判断文档的相关性时,其判断标准并不是单一和静态的。在真实的搜索环境下,不同的相关性维度之间会出现不同程度的动态交互作用,且这种交互作用会影响用户对文档最终的相关性判断。因此,对不同维度之间的动态交互情况的研究是必要的。在本文中,用户的动态相关性研究分为两个主要方面:第一,对于一个查询(Query),用户在判断某一文档时,对不同的相关性维度的关注程度是动态且交互的;第二,在一轮包含多次查询的检索会话(Session)中,对其中的每个查询,用户在判断文档的相关性时,会动态地受到上一个或前几个查询结果的影响。针对上述动态性的两个方面,本论文基于多维度用户相关性模型(Multidimensional User Relevance Model,MURM),从模型的7个相关性维度出发,提出不同的探究问题及相应的假设,同时设计验证实验,借助排序学习算法Learning to Rank框架,在主流搜索引擎的真实检索日志数据集以及TREC数据集上进行实验。实验结果证明,两种动态性普遍存在于文档相关性判断过程中,且考虑这种动态性时,检索模型的排序效果会受到不同程度的影响。该工作对于以用户为中心的搜索引擎的性能优化以及个性化检索的实现提供了有价值的启发,并可以为其他包含多维度决策的自然语言处理相关任务提供新的研究方向。
其他文献
植物在生长过程中,会遭遇各类逆境的影响。为了更好的生存,植物进化出各种应答机制,响应不利环境。近年来研究发现,促分裂原活化蛋白激酶(MAPK)级联途径在调节植物生长发育、
语义标注技术在实现服务自动发现和组合中具有非常重要的作用。研究者们将本体知识与Web服务中的元素相匹配,来弥补服务中只有语法没有语义的缺陷,并通过大量的服务测试来检
随着全球气候急剧变化,减少对化石能源的依赖,大力发展作为重要清洁能源的风电是国际社会逐渐达成的共识。中国能源发展有关政策表明,规模化风电接入电网已成为中国电力行业
在机器视觉领域中,目标检测一直是重点研究的方向。目标检测在无人机,智能驾驶,智能航渡等领域有着广泛的应用。如何快速且准确的检测目标是目前目标检测算法面临的亟待解决的一个重要问题。2012年,Alex Net以巨大的精度提升获得ILSVRC分类比赛冠军,深度学习由此走入人们的视线。随着近几年的不断发展,深度学习已逐渐机器学习主流的研究方法,引导着人工智能的发展。基于卷积神经网络的目标检测算法主要可分
主动配电网(Active Distribution Network,ADN)智能化程度不断提高,对负荷控制管理的能力越来越强,当其发生永久性故障后迅速进行故障恢复,可以减少经济损失,提高供电质量等,
磁流变液(Magnetorheological Fluid)是一种新型的智能材料。在外加磁场的作用下,自由流动的液体随着磁场强度的增加能在毫秒间从液态变为半固态,且变化过程是可逆的。磁流变
原生生物是海洋浮游生物群落的主要组成部分,在海洋生态系统中占有十分重要的地位:真核藻类是海洋初级生产力的重要来源;原生动物通过摄食将物质和能量通过微食物网向更高营
砒砂岩区是黄河流域典型生态脆弱区和粗泥沙集中来源区,在多种侵蚀营力的影响下,土壤侵蚀十分严重。研究风、水、冻融等多种动力作用下的砒砂岩复合侵蚀过程及规律,为砒砂岩
自2015年以来,高考全国卷已连续五年选取任务驱动型作文来对学生进行考察。作为一种新的作文题型,任务驱动型作文备受师生关注,但在教学实践中却存在诸多问题,尤其是任务驱动型作文的审题立意,因缺乏系统的研究成果作指导,这让许多师生感到很茫然。虽然许多研究者在“任务驱动作文”的研究中取得了一定的成效,但很少能与教学实践相结合,也不能很好地解决作文审题立意中的问题。针对这一现状,笔者进行了实地调研,并通过
学位
矮砧密植的栽培方式以其经济利用土地、早产、丰产、利于管理等优点已成为目前我国苹果生产发展的方向。矮化砧木的利用是实现树体矮化的主要措施之一。矮化砧木可以合理调控