基于用户行为模型的信息检索离线评价方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:myloud911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了缓解用户有限认知能力与互联网海量信息之间的矛盾,信息检索已经成为互联网服务中一项不可或缺的技术。在信息检索的相关研究领域中,对其离线评价方法的研究一直以来都受到研究者们的广泛关注。为了使得离线评价方法的评价结果与真实用户的体验尽量吻合,在离线评价指标的设计中引入用户行为模型就成为了信息检索评价长期以来的研究热点。然而,现有的离线评价方法仍然存在一定局限:一方面,已有的离线评价指标在构建用户行为模型时没有充分考虑认知因素对用户行为的影响;另一方面,以往的工作对离线评价指标在描述用户行为和衡量用户满意度两方面表现的一致性缺乏完整验证。 本文围绕基于用户行为模型的信息检索离线评价方法开展了系统的研究,通过深入挖掘用户搜索认知过程,着力解决离线评价指标设计中的一系列挑战性问题:(1)针对已有搜索交互模型无法准确解释用户终止行为的缺陷,提出了动态建模用户期望收益与成本的浏览交互模型,并基于该模型设计了离线评价指标的统一框架。该框架不仅整合了已有的多种评价指标,其衍生的新指标也更加贴合用户的满意度;(2)针对传统相关性评估方法难以直接应用于图像搜索场景的问题,构建了结合主题相关性和图像质量的搜索效用评估模型,并设计了更加符合用户体验的图像搜索评价指标。该工作揭示了图像结果的不同维度对效用评估的影响,为不同意图下的图像搜索性能评价提供了更加符合用户需求的效用评估方案;(3)针对已有搜索会话行为模型未考虑用户信息需求探索式演进的问题,将认知心理学中的近因效应引入效用累积模型,并设计了相应的会话级评价指标。该工作为用户在搜索会话中的效用累积过程提供了解释,并能够更好地衡量用户对整个搜索会话的满意度;(4)针对用户满意度在实际场景难以收集的问题,对离线评价指标在描述用户行为和衡量用户满意度两方面表现的一致性开展了系统性验证。该工作不仅发现了离线评价指标优化与用户行为模型构建之间的内在联系,也为用户行为与用户满意度之间的一致性表现提供了经验依据。 为开展上述研究,本文基于实验室研究和实地研究等用户实验方法构建了一系列搜索用户行为与满意度反馈数据集合,这些数据集合不仅验证了本文所提出的相关离线评价方法对于指导搜索系统性能改进的有效性,也有助于帮助研究者们推进信息检索评价领域的研究工作。
其他文献
目的:子痫前期是常见的妊娠期并发症,以妊娠20周后出现的高血压和尿蛋白为特征。母体免疫系统的激活和血管生成失衡参与子痫前期的发生发展。Toll样受体9(TLR9)在先天免疫中占有重要地位。血管内皮生长因子A(VEGFA)和可溶性血管内皮生长因子受体1(sFLT1)分别是重要的促血管生成因子和抗血管生成因子。本研究的目的是探究TLR9是否在母胎界面通过调节VEGFA和sFLT1的表达从而抑制血管生成
导电水凝胶是一种结合电导性与水凝胶多孔吸水特性的新型柔性电极材料,由于其电性能和机械性能的可调性被广泛关注。然而,目前大多导电水凝胶的制备方法是通过电活性填料与绝缘聚合物基质结合方式制备,该方法在获得较好机械灵活性的同时不可避免的影响了其电学性能。基于此,本论文致力于开发兼具高导电性和机械灵活性的导电水凝胶电极材料及探索新型制备工艺,以实现低成本大面积制备高性能、可集成的超级电容器件,从而适应并推
第一部分:妇科多发性原发性恶性肿瘤的临床特点和预后分析目的:本部分的研究拟回顾性、连续性收集单中心妇科多发性原发性恶性肿瘤(multiple primary malignant neoplasms,MPMN)的临床资料并完成随访,从发病年龄、发病部位、间隔时间、FIGO分期、治疗方式及生存时间等方面对其行综合分析,旨在探讨妇科恶性肿瘤相关的MPMN的临床特点和生存预后情况。方法:回顾性、连续性收集
目的膀胱癌(BCa)是泌尿系统最常见的恶性肿瘤之一。既往研究显示,骨髓间充质干细胞(BMSC)来源的外泌体是转移内源性分子的载体,在BCa的发生发展中起着重要作用。本研究旨在探讨含BMSCs来源的外泌体中miR-9-3p在BCa恶性进展中的作用机制。方法第一部分:通过生物信息学分析从基因表达综合数据库(GEO)中筛选出在BCa中差异表达基因(DEGs),并在BCa组织和配对癌旁正常组织中用qRT-
国际上管理自然灾害最为常见和有效的方法是保险机制,地震保险制度的建立和发展有助于提升区域内地震风险保障水平。自汶川地震以来,政府和社会大力呼吁构建地震保险制度,目前,我国地震保险的顶层设计已经出炉,意味着地震保险的发展进入了快车道。然而地震保险的实际市场表现却不尽人意,经营风险高、盈利难导致保险经营者们始终对地震保险保持高度警惕状态,地震保险认知程度低极大程度上限制了有效需求和覆盖率,地震保险市场
随着网络服务终端站点数量的急剧增加、网络服务对于时延要求和安全性能的不断提高、及网络能耗的显著增大等发展趋势,新一代物联网系统面临着一系列新的技术挑战。本学位论文针对第六代移动通信的愿景展望和技术发展导向,紧密围绕着物联网系统的网络接入场景主要研究终端站点无线接入的安全性方案、物联网终端站点的无线充电与无线信息传输、异构物联网的干扰抑制、终端站点计算任务的时延理论分析、以及基于智能反射面的物联网接
本文主要是基于介质波导滤波器开展技术研究。这类滤波器与平面微带滤波器、介质集成波导滤波器相比,具有更高的Q值和功率容量;与金属波导滤波器、加载介质构成的介质谐振波导滤波器相比,具有更小的尺寸,非常便于集成于现代射频与微波电路中。近几年,随着陶瓷介质工艺的不断成熟,介质波导滤波器以其优异的性能被广泛应用于基站、终端等现代无线通信系统中,国内外学者陆续开展了大量的技术研究和相关工程应用。本文主要针对直
锂离子电池(LIBs)具有能量密度高、工作电压高、循环寿命长、自放电低、无记忆效应等特点,被认为是便携式电子设备和电动汽车的理想储能器件。一方面,工业化的石墨负极由于比容量低而无法满足锂离子电池对能量密度日益增长的需求;另一方面,具有高比容量的新型电化学活性材料,如金属氧化物、金属硫化物、硅等,在充放电过程中体积变化较大,导致严重的粉化和容量衰减。因此,具有分级结构的多孔碳电极材料受到了关注和开发
得益于基因组学技术、高通量测序技术及生物信息分析技术的迅猛发展,研究人员能够获得海量生物数据对疾病进行深入研究,并在许多领域取得了丰硕成果。然而,对复杂疾病的认识,并未如人们预期那样获得革命性突破,以GWAS研究为例,目前所识别主效应的位点只能解释表型变异的部分遗传度,即遗传性缺失(missing heritability)现象。事实上,复杂疾病的发生发展,是由外在环境暴露因素、内在遗传因素相互影
猪作为重要的农业动物和理想的潜在动物模型,在农业生产和生物医学研究中扮演着重要的角色。肌肉生长和脂肪沉积是猪的重要经济性状,且不同解剖学部位的肌肉和脂肪具有显著的表型差异,而带来这些差异的具体分子调控机制尚不明确。目前,猪的基因组(Sscrofa 11.1)虽完整度较高(Contig N50:48.23 Mb),但其基因组注释并不完善。因此,构建精准完善的转录组图谱(功能性的蛋白编码转录本和调控性