【摘 要】
:
随着信息检索技术的不断发展,人们对其的要求也越来越高。通常情况下,大多数web检索系统只是根据文档与查询的匹配度返回结果文档集并基于排序原则PRP(probability ranking p
论文部分内容阅读
随着信息检索技术的不断发展,人们对其的要求也越来越高。通常情况下,大多数web检索系统只是根据文档与查询的匹配度返回结果文档集并基于排序原则PRP(probability ranking principle)对结果文档集进行排序。这样的排序结果从内容上看会比较单一,容易造成冗余,故不能满足用户对信息多样性的查询需求。更重要的是,由于查询词的歧义性,内容的单一会造成用户找不到自己所需要的信息,并因此放弃此次查询。在信息检索中,搜索结果多样化作为解决此类问题的方法越来越被关注,其旨在产生排序结果集,使得前N篇文档可以覆盖用户查询的更多子意图并有较低的冗余性。到目前为止,已经提出很多启发式的多样化模型,但这些模型只考虑到有限的一些特征以及需要大量的工作调节模型中的参数。本论文的重点是通过建立学习模型解决以上问题。具体工作是,首先,通过分析启发式的多样化排序模型Affinity Ranking模型,为我们设计Learning Affinity Ranking模型提供动机。然后,对于模型的学习排序算法我们设计一个可以将多样化评价指标加入算法损失函数的学习算法,通过此学习算法,建立比原始Affinity Ranking模型更加高效且具有鲁棒性的排序模型。另外,本文的另一个具体工作是将已提出的多样化模型进行组合设计更加高效的多样化排序模型,然后提出文档排斥理论并设计模型学习算法。我们的两个实验都是实施在TREC Web Tracks 2009年到2011年的多样化任务上,实验的结果从有效性和鲁棒性上说明我们的学习模型优于之前一些模型。
其他文献
随着信息技术及互联网的迅速发展,生产生活中的各种行为都被数字化信息化,人们每天处理着各式各样的数据,数据不仅形式多样化而且数据量也呈现爆炸式增长。如何使用数据挖掘
历史建筑作为城市文化的重要组成部分之一,因具有历史文化价值与建筑艺术价值往往不能拆除重建。保护和加固再利用历史建筑已经成为发展的趋势,因此历史建筑的检测和加固的应用研究十分必要。旧有的历史建筑因服役时间过长,建筑结构不能满足现行建筑结构规范,具有一定的风险。因此需要对历史建筑进行合理和科学的检测鉴定,再对其进行加固设计,达到再利用历史建筑的目的。本文在查阅大量资料的基础之上,通过实例沈阳帅府,对砖
当今,无线传感器网络随着科学技术研究的深入得到了迅猛发展,应用范围将涉及目标跟踪、精细农业、工业制造、军事作战等方面。本文主要针对无线传感器网络目标跟踪中的分布式
石墨烯的优异性能引起人们对类石墨烯二维材料的广泛关注,进而实现其在场效应晶体管、功能复合材料、储能材料、等方面的应用。二维材料的性质与结构密切相关,制备大面积、高质量、性质可控的二维材料是实现其应用的先决条件。化学气相沉积(CVD)法提供了制备大面积高质量二维材料的可控方法,具有设备简单、成本低廉、操作方便等优点。采用CVD法能够制备得到单晶二维材料,同时也能通过调控生长参数及其它反应条件得到薄膜
计算机对文本的表示和理解一直是一个我们亟待解决并一直在尝试的问题。在以前的信息检索任务中,被检索的文档比较长,已经包含了非常丰富的信息。但是在流行的文本问答等任务
印刷电路板(Printed Circuit Board,PCB)中的导线承担着电路的绝大部分电气连接,因此,导线检测是PCB检测中的关键环节,检测质量的好坏直接影响着故障位置和故障原因的准确判
图像融合是指将多个传感器针对同一对象在不同时间或不同视角采集到的图像进行信息融合以生成包含更多信息的新图像。图像融合可满足人们对图像信息的不同需求,提高系统对目
电子文档具有易于编辑、便于存储和传输的特点,许多涉密文件都会以电子文档的形式存储在电脑磁盘上,作为企业资产的一部分。电子文档提高了办公效率,但是使用过程中的数据泄
三维片上网络(Three-Dimensional Network on Chip,3D NoC)互连结构是三维集成电路(Three-Dimensional Integrated Circuit,3D IC)技术与NoC互连结构相融合的产物,并因其具有
近几年来随着光电技术的发展,CCD彩色相机能够获得更多的图像数据,更好地对目标进行识别。新兴的CCD图像传感器具有体积小、分辨率高、灵敏度高、图像畸变小、抗冲击、无残像