基于用户点击信息检索评价方法综述

来源 :第十一届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:shirleyzuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
评价是信息检索研究长期关注的焦点,推动信息检索技术的进步.在简要分析Cranfield评价的优点和不足、基于检索日志进行检索评价的巨大潜力后,本文论述从搜索日志中获得可靠文档相关性估计存在的困难,分析了近年国内外研究人员提出的若干典型点击模型,并对其就可扩展性、增量可计算性、点击预测精度、模型的复杂性等方面进行讨论.简单的点击模型无法描述真实点击的多样性,点击预测精度也刻氏;复杂的模型带来的是计算上巨大的时间和空间开销。点击模型应在精确性与复杂性之间进行取舍。将点击贝叶斯斯网络简化为两个部分可观察的马尔可夫时序模型,做了模型复杂度与预测精度之间的折衷:有人考虑查询所类别不同,用户检索决策出发点不同,除了保证文档相关胜推理的可靠性外,一个理想的点由模型应能处理大规模、TB级点击数据,同时能根据数据更新动态更新模型。点击链模型、依赖点击模型、动态贝叶斯点击网络兼具三个特性。上述所有研究工作或是基于可控实验环境中,与真实网络用户行为有一定差距。比如检索日志可能包含大量非真实用户-网络爬虫行为,用户在检索过程受到广告干扰等等。上述所有研究工作或是基于大规模群体用户的点击行为分析,尤其是对同一查询,需要大量的用户点击信息,难以处理用户访问频度低的长尾查询词。
其他文献
采用FLUENT数值计算软件对S3012低渗高应力采煤工作面不同钻孔间距情况进行研究,针对瓦斯高效抽采问题对抽采间距开展数值计算,研究适当扩大钻孔间距后煤层钻孔瓦斯压力分布
对检索结果的聚类能够便于用户在大量搜索结果中快速找到需要的信息,传统文本聚类技术在检索结果聚类上取得的效果并不好.Lingo算法采用LSI(在语义索引)对检索结果进行聚类,
三、模拟量输出方式 M16机心共有十个模拟量输出,除了音量VOL是PWM输出之外,其余九个模拟量都是0~5V直流电压输出,其相应引脚内部都设计有专门的D/A转换器,因而在片内已将“P
故障现象 一台夏警VC—A5080T录像机,接通电源VTR开关能进行加载,多功能显示屏工作状态显示也正常,按重放或录像健时加载导柱、副加载臂、压带轮均能到位,磁鼓电机转动,但主
南希·罗宾斯有一个天赋,能用表面上看起来再寻常不过的物件创造出极不寻常的雕塑作品。许多年来,她一直在废物堆积场搜寻家用电器、床垫、飞机部件用以创作,最近则改成使用
淮北选煤厂入厂原煤性质变化大、配选方案多、换选频繁,重介精煤灰分控制难度大,在生产实践中,通过运用“信息库比对定位法”、“多节点产率计算法”、“离线结合目测精煤灰
论述了在从数字化矿山向智慧矿山建设的进化中,煤炭相关数据大量产生,针对数据治理研究了与其相关的关键技术.首先实现数据交换,打破“数据孤岛”,通过数据载体和数据传输通
国际民航组织于1983年成立了未来航行系统(FANS)特别委员会,对现行使用的陆基系统的局限性与未来星基系统进行了充分的研究与论证,并于1988年提出了以卫星技术为特征的通信、
介绍了煤矿井下用梭车的主要作用和整体结构,结合多年的维护经验,对梭车制动器的日常维护和故障排查进行了详细说明,并对梭车卷电缆装置的维护以及拆解安装过程进行了详细介
采用高压密闭微波消解仪预处理煤样,并用冷原子吸收分光光度法测定其中的汞.研究发现,选择硝酸-盐酸-氢氟酸-双氧水体系可将煤样有效消解,利用国家标准物质GBW(E)110108煤103