搜索引擎评价指标特性的研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:risk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对搜索引擎的检索质量进行评价是信息检索领域的一个重要方面,因此,人们提出了许多搜索引擎评价指标。各种评价指标本身各有特色,如有的评价指标稳定性较好,但敏感性较差;另一些评价指标则反之。如何得到综合特性最优的评价指标,从而对搜索引擎的检索质量进行准确、全面、令人信服的评价,是信息检索领域面临的一个重要的难题,为此,需要准确、可靠的评估方法。本文提出了基于t检验的评估方法,同时使用该方法对文档二值相关和多值相关两种情形下的五种常用评价指标进行了实验研究,它们是MAP(mean average preecision,平均查准率)、P@10(precision at10 document level,前10个文档的查准率)、RP(recall-level precision,可查全水平查准率)、RR(reciprocal ranking,第一位相关文档的倒数)、NDCG(normalized discounted cumulative gain,规范化带减量的累积增长)。研究结果表明,两种情形下评价指标NDCG的综合特性都是最好的,其次是MAP,然后是RP和P@10,综合特性最差的评价指标都是RR。此外,本文还提出了评价指标困难度指数的概念,它可以有效地帮助评价人员对使用不同评价指标得到的不同搜索引擎之间的检索质量进行快速地比较,研究结果表明,评价指标RR的困难度指数最小,其次是NDCG、P@10、RP,困难度指数最大的评价指标是MAP。  通过本文的研究和讨论,基于t检验的评估方法可以作为评估搜索引擎评价指标综合特性的有效方法。它使得计算过程更简单、结果更可靠,并且可以量化比较的结果。该方法不仅能应用于在文档二值相关的情形下的评价指标,也能应用于文档多值相关的情形下的评价指标。另外,困难度指数概念的提出可以帮助信息检索评价人员节省大量的评价时间,提高评价的效率。
其他文献
随着移动互联网的快速发展以及Android操作系统的持续更新,运行在Android系统上的应用程序也越来越复杂和庞大,使得Android手机软件开发者必须使用基于该平台的第三方库来快
智能交通系统平台(ITS Platform)的在21世纪的发展中用到了很多先进的理论和技术,是下一代交通系统的发展方向。使用信息化技术采集、处理、管理交通信息是系统中的重要部分,其中
随着计算机视觉、计算机图形学等技术在各个领域的广泛应用,以及智能化模拟技术的快速发展,三维重建相关技术已是众多研究学者的研究热点。点云重建过程是基于多视图三维重建
移动互联网的发展,加快了数据的产生速度;促进了云计算、大数据等数据处理技术的进步。为解决通用搜索引擎应对海量数据检索时返回信息量大、查询精度低等弊病,各类垂直搜索引
灰度图像的彩色化是计算机图像处理中一个重要的组成部分,也是最近几年中得到各国计算机专家关注的热点话题。其主要目的是将彩色图像的颜色信息迁移到灰度图像中去,使得灰度图
社会医疗保险制度作为国家社会保障体系的重要组成部分,在保障劳动者身体健康、稳定社会秩序、安定人们生活等方面发挥着重要作用。然而,随着医疗保险事业的不断发展,医疗保险领
模型检测是一种完全自动化的系统可靠性与安全性的形式化验证技术,目前已经广泛应用于集成电路、通信协议、安全协议等软硬件系统的验证。模型检测技术基于对系统状态空间的遍
随着智能监控系统在现实生活中越来越多的应用,智能监控算法的研究也已经成为计算机视觉领域的一个热点。行人携物检测是物品盗窃、物品交换等异常行为识别研究的一部分,也正在
计算机及互联网的普及在带给人们的生活和工作丰富资源的同时也使信息呈现爆炸式增长。随着网络中文本数据呈指数级增长,信息的人工分类和管理也已经被计算机自动分类所替代。
数字全息术是一种全新的技术领域,这种技术领域涉及了光电技术以及计算机技术。这种技术有非常多的优点,例如非接触、准实时、高精度等等。数字全息中一个很重要的步骤就是位相