基于分类模型的查询扩展方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:yya_ch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询扩展作为查询优化的重要组成部分,对改善信息检索系统的性能起到了至关重要的作用。传统的伪相关反馈查询扩展方法虽然在一定程度上提高了检索性能,但选择的扩展词中会包含一部分与原查询不相关的词语,这对检索性能的提升产生了不利影响。提出了一种基于分类模型的查询扩展方法,该算法综合候选扩展词的统计信息和多种特征,采用朴素贝叶斯分类模型对初次得到的候选扩展词进行再次分类选择,进一步去除与查询词相关性小的扩展词。在TREC 2013数据集上的实验结果表明,提出的查询扩展方法能够有效提高用户查询的查准率和查全率。
其他文献
数据泄漏是导致Web沙箱逃逸的重要原因,即在未授权情况下,程序可以访问系统的敏感数据。已有的Web应用安全分析方法不完全适用于发现Web沙箱的数据泄漏。设计一种面向数据泄
我们以前的工作观察到纹状体边缘区内有密集的P物质纤维及终末分布,本文用原位杂交和免疫组织化学方法研究了大鼠纹状体边缘区内P物质受体(SPR)的表达及分布,原位杂交结果发现P物
基于用户朋友关系的社交网络项目推荐技术可能泄露用户-项目隐私偏好。传统的匿名化方法由于过分依赖特定知识背景假设而存在内在的脆弱性。提出一种基于差分隐私的社交网络
混合译码放大转发(Hybrid Decode-Amplify-Forward,HDAF)协议与放大转发、译码转发协议相比,能在很大程度上提高系统的性能,成为近年来的研究热点。在此,研究了在混合译码放大
针对现有恶意程序行为特征检测存在的不足,采用多轨迹检测方法,用文件操作、网络访问、内存资源访问的行为特征构建出三维恶意行为特征库。在构造投影数据库的过程中,结合AC
对称多处理器的飞速发展和近年来提出的动态异构处理器(DHMP)为性能优化提供了新的机遇.一个机遇是找出程序每个阶段的性能瓶颈,提出了静态程序阶段分析方法,即通过分析结构参
带数据约束的概率实时系统是指一种既带有概率时间约束又带有数据变量约束的计算系统。目前将离散数据约束和连续时间约束统一在一个概率模型中的规范及验证研究较少。提出了
针对高能耗导致的仿人机器人难以大规模实用化的问题,提出了一种新的仿人机器人参数化跑步步态优化方法。分析了不同跑步步态参数对仿人机器人水平、垂直方向的稳定性及能耗
由于高通量测序技术产生了海量基因读段数据,并行的基因读段定位算法成为近年来的研究热点.对基因匹配算法进行研究,提出了一种基于MapReduce的基因读段定位改进算法,并且通