检索结果多样化及其评测方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:bcrav4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎作为用户访问互联网的入口,其检索结果是否能够满足用户查询需求直接影响着用户使用互联网的体验。然而,用户的真实查询意图却很难从查询词本身获取,这是由于当前广泛采用的关键词查询与选择性浏览的搜索引擎交互方式使得用户提交的查询词往往简短甚或歧义。针对这一问题,搜索引擎通常采用对检索结果进行多样化处理的策略加以应对。检索结果多样化旨在通过在检索结果中放置与不同内容相关的网页,使得该检索结果能够在尽可能靠前的位置满足不同用户的信息需求。其研究内容主要包括两个大的方面,即如何准确、有效地产生多样化的检索结果以及如何合理评价一个经过多样化后的检索结果的好坏。围绕这两个主要方向,本文从以下几个方面展开研究工作:1.检索结果多样化方法研究:针对当前研究中几乎都是采用贪心搜索算法来近似解决检索结果多样化中的NP-hard问题,本文提出通过利用文档之间存在的局部有序性对全搜索过程进行无损剪枝,以提高全搜索的效率。根据搜索引擎用户在通常情况下只浏览检索结果第一页的事实经验,本文进一步提出了“关键文档”与“搜索窗口”的策略来对全搜索过程进行剪枝。通过实验,我们验证了本文所提出的算法在能够提供足够检索系统进行实时计算的效率的同时,可带来比贪心算法更好的性能。2.多样化检索结果评测方法研究:针对已有的多样化评测方法在评测检索结果时将不同类型的用户意图同等看待的问题,本文首先提出在评测多样化检索结果时,用户不同类型的意图在满足程度上应当具有不同的特征。而后引入衰减函数来刻画这样的特征,且不同类型的意图对应着不同的衰减函数。最后,本文提出考虑了用户意图类型信息的检索结果多样化评测框架,并将用户意图的类型具体到信息类与导航类来详细讨论该框架的特性。通过实验,我们验证了由本文提出的衰减函数所构成的多样化检索结果评测方法优于现有的方法。3.多样化检索结果评测方法的分析方法研究:针对已有的多样化评测方法的评测大都从分析评测方法某一方面的特性,如稳定性、直观性等,来比较不同评测方法的优劣,本文提出通过比较多样化评测方法与用户偏好的相关性来对多样化评测方法进行分析,并提出了基于用户偏好的加权相关性方法来定量计算。该方法通过计算评测方法与用户检索偏好之间的加权相关性,克服了其他方法在评测多样化评测方法时极少考虑到用户行为信息的缺点。
其他文献
在前人对川东地区长兴组沉积相研究成果的基础之上,运用沉积学及层序地层学理论,结合野外剖面的观察和室内岩石薄片的鉴定以及岩石学、古生物学等沉积相标志,分析研究区长兴
教师的工作态度是学校在管理工作过程中经常遇到的一个问题,它通过具体行为深刻的反映了教师的心理情况。教师的工作态度会直接或间接的影响管理工作的正常运行,以及后续工作的
多智能体(无人车辆、移动传感器等)系统由于其在空间和功能上的分布性,较强的容错性、鲁棒性和可扩展性等诸多优点,广泛应用于军事、工农业生产、空间探索、医学、交通控制、
以山东交通职业学院为例,对高职高专类院校航海英语教学的现状进行客观分析,并就如何解决这些问题提出了相关的教学改革建议,以改善航海英语教学现状,提高学生应用英语的能力。
随着社会的不断发展,网络科技的水平也在不断提高,然而图书馆也在网络环境下不断的进行改革,网络环境对图书馆的影响是广泛的并且具有深刻意义的。为了更好的适应现代社会的发展
目的探讨美托洛尔联合他汀类药物用于临床分组治疗心肌梗死的临床疗效。方法以我院收治的110例心肌梗死患者为研究对象,将110例患者根据临床治疗方式的不同分为对照组与观察
医院档案是医院在工作活动中形成的文件、簿册、图表、录音、录像、盘片等各种门类和各种载体档案,是医院的宝贵财富。加强对这一信息资源管理对医院领导决策科学化和医院现代
期刊
社会规范系统对社会的控制主要是通过相应的手段系统完成的,经济利益、政治权威、教育文化熏陶,舆论引导等手段构成了社会控制手段系统的基本控制手段。在构建商业贿赂社会控制
本文从高校财务工作科学定位着手,提出了高校财务工作必须以服务教学为目的,以促进和深化教学改革为手段,深化资金预算管理,通过财务管理改革促进教育教学质量的提高,完成大学使命
目的探讨心肌钙蛋白I(cTnI)与同型半胱氨酸(Hcy)联合检测对提高非ST段抬高心肌梗死(NSTEMI)诊疗效果的作用。方法检测47例NSTEMI患者(NSTEMI组)在治疗前、后及63例健康体检者(对照组)的