信息检索系统的偏差-方差评价体系

来源 :天津大学 | 被引量 : 0次 | 上传用户:lienkai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索评价指标主要有有效性和稳定性指标。目前,这些稳定性指标和有效性指标大多数都是分开定义的。研究者们发现系统平均有效性性能的上升通常以牺牲系统的稳定性为代价,即系统的有效性和稳定性之间存在着有效性-稳定性权衡。然而,系统的有效性-稳定性权衡还没有被系统地研究。传统的信息检索评价基于固定的文档集,此时信息检索系统的有效性和稳定性基于一组信息需求。当文档集是来自一个更大文档集的样本时,系统的有效性和稳定性及文档集作为样本的影响还没有得到充分地研究。此外,显著性检验和偏差-方差评价体系之间的关系在本文中得到了探究。本文基于均方误差的偏差-方差分解理论提出了信息检索系统的偏差-方差评价体系。该评价体系不仅能够分别评价系统的稳定性和有效性,还能够评价系统的整体性能(有效性和稳定性)。系统稳定性和有效性之间的关系也在该评价体系下得到有效研究。在Ad-hoc和Web任务上的实验结果表明,系统的有效性和稳定性之间存在着权衡。在Ad-hoc上的实验表明per-topic方差对基于排序的系统比较没有明显的影响,但基于显著性检验的系统比较易受per-topic方差的影响。在Session任务上的实验结果表明查询修改和增加用户数据能够同时提升系统的有效性和稳定性。
其他文献
压电陶瓷作为一种关键性功能材料,因其具有机械能与电能相互转换的特性,从而广泛应用于电子、医疗、生物等重要领域。铌酸钾钠(KNN)基压电陶瓷因其优异的压电性能与较高的居里
采用木材建造的大跨度单层网壳不仅造型优美、受力合理,且绿色环保,在国外已有较多工程实例。我国虽有个别大跨木网壳应用案例,但相关研究较少,分析设计技术也尚不完善。木网
胡桃楸播种苗主根较长,侧根较少,影响移栽质量和效率。为缩短主根长度,促进侧根发育,提高移栽成活率,本研究以胡桃楸播种苗为研究对象,设置3种控根处理:①胚根短截(RC1:截1/2
采用溶液聚合法合成甲基丙烯酸丁酯-甲基丙烯酸羟乙酯(HEMA)共聚物和丙烯酸丁酯-HEMA共聚物,将两者溶液以体积比为85:15进行共混,采用湿法纺丝法纺制中空纤维(HF)。在一定温
随着互联网技术的快速发展,海量信息被发布在网络上,我们来到了信息大爆炸的时代,信息背后隐藏着丰富的知识,知识可用于很多领域的决策支持。知识图谱以更接近人类认知世界的
本文利用变分法,Morse理论以及临界群在同伦不变式的中保持不变的性质性研究在有界区域上,泛函在非共振条件或者共振条件下基尔霍夫型方程解的存在性,并在此条件下找到临界群的孤立的临界点。将得到的结果进行强制限制,并利用变分法,三临界点定理,山路引理证明了基尔霍夫型方程至少存在三个非平凡解.我们研究的是下面的基尔霍夫型方程其中a,b>0是实常数,假设(f0)/∈C1(ΩxR,R),/(x,0)=
代步工具的发展,加速了能源危机的急剧扩大,寻找新型能源是必经之路。纯电动汽车通过电池组直接驱动电动机运转,进而推动汽车行驶。在电动汽车辅助设备中汽车空调耗能最大,所
随着我国城市规模的扩大和产业结构的调整,各个省市均出现了大量废弃或闲置的旧工业建筑。在改造的基础上再生利用则是目前应对闲置旧工业建筑的重要方法,也是必然趋势。通过
随着科学技术的进步和生产力的提高,人们对电力系统的需求也正在日趋增长。电容器作为储能设备,以其电容量大、充放电寿命长、快速充放电等优势在新能源汽车、光伏系统和电栅
为了深入研究信号分析中有效的数学工具——正交函数和正交变换,本文从Legendre正交多项式出发,构造了一类由分段多项式组成的正交函数系,称之为广义k次V-系统。相较于V-系统