基于Dirichlet分布语言建模的信息检索技术研究

来源 :2008年全国理论计算机科学学术年会 | 被引量 : 0次 | 上传用户：lqylzy

【摘要】

：

基于多项式的一元语言模型不能表示文档中的突发(Burstiness)现象,而基于Dirichlet分布的语言模型能够较好地处理突发现象.本文分析和讨论了几种基于Dirichlet分布的语言模型

【作者】

：

文健李舟军

【机构】

：

国防科技大学计算机学院,湖南,长沙,410073北京航空航天大学计算机科学与工程学院,北京,100083

【出处】

：

2008年全国理论计算机科学学术年会

【发表日期】

：

2008年9期

【关键词】

：

突发现象信息检索语言建模文档模型平均精确度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于多项式的一元语言模型不能表示文档中的突发(Burstiness)现象,而基于Dirichlet分布的语言模型能够较好地处理突发现象.本文分析和讨论了几种基于Dirichlet分布的语言模型,并以DCM模型为基础,分别对文档和查询项进行语言建模,然后采用KL-divergence方法来度量文档模型和查询项模型的相似度.在TREC数据集上的实验表明,与基本的模型相比较,采用DCM模型能够提高信息检索的平均精确度.

其他文献

围绕中心服务大局规范高效务实有为——对做好办公室工作的几点思考

【正】办公室是一个综合协调、服务、管理机构,处于协调机关各部门、连接领导和基层的枢纽地位,具有参谋、助手、协调、服务、督办等基本职能,担负着上情下达、下情上报、对

期刊

下情上报上情下达枢纽地位管理机构印章管理政治理论预则立学习理论照章行事合理运筹

详解“杰达姆”精确制导炸弹

美国空、海军联合研制的“杰达姆”(JDAM)全天候精确制导炸弹系列,在上世纪末、本世纪初的几场局部战争中出尽了风头,可谓武器中的“明星”。在阿富汗进行的“持久自由”行动

期刊

JDAM美军

无功补偿的原理及经济效益分析

【正】去年我台进行了大规模的机房改造,包括供配电系统的扩容,并安装了无功补偿设备,在节能降耗方面已经取得明显的效果,现就无功补偿方面的知识进行探讨。一、无功补偿基础

期刊

无功补偿直流电路力率调整电费感性负荷线路损失供用电规则用户功率感性负载就地平衡补偿

片内二级Cache的静态功耗优化技术研究

随着集成电路制造工艺进入超深亚微米阶段,静态功耗在微处理器总功耗中所占的比例越来越大,尤其是片上二级Cache。在开发新的低漏流工艺和电路技术之外,如何在体系结构级控制

期刊

微处理器二级CACHE静态功耗ADSRmicroprocessorL2 cachestatic powerADSR

基于分治的子集积问题DNA计算机算法

如何减少DNA计算机在求解大型科学问题中以问题输入纯指数增长的DNA链数，已成为DNA计算机研究的重要内容。本文将分治策略应用于子集积问题的DNA分子计算中，提出一种求解子集积

期刊

DNA计算NP完全问题子集积问题分治法DNA-based computin NP-complete problem： subset-product pr

上帝收回了给他的礼物,但他没有倒下

火星撞地球般的骑勇大战进行到第三节还剩一分钟,勇士潮水一样的进攻已经让骑士疲态尽现。杰夫-格林切入篮下接到科沃尔从45度角三分线外的传球,杀向篮筐一个远距离滑翔单手

期刊

礼物远距离

周口联营职业中专篮球开展现状调查

通过文献资料法、问卷调查法、数理统计法等研究方法对周口联营职业中专篮球的开展状况进行调查与分析,得出以下结论:周口联营职业中专篮球专业教师应当提高自己的教学能力和

期刊

周口职业中专篮球开展现状

北海广电30年回顾

【正】区辖北海市从她诞生之日起,就注定与沿海开放城市结缘,走在了中国对外开放的前沿。北海的广播电视事业也得风气之先,在过去的30年里,与时俱进,与科技并肩,走过了从无到

期刊

广播电视事业自办节目沿海开放城市记录者国际频道晚间新闻电视节目央视二套电视新闻第一

莫言说的两种人

<正>1.我敬佩两种人:年轻时陪男人过苦日子的女人,富裕时陪女人过好日子的男人。2.我远离两种人:遇到好事就伸手的人,碰到难处就躲闪的人。3.我挂念两种人:相濡以沫的爱人,肝

期刊

男人

基于NURBS的扭变曲面的计算机建模方法研究

本文首先介绍了扭变曲面CAD在国内外的发展情况和NURBS方法的概念,通过推导曲面初始二维数据向三维数据的转换关系,提出一种将NURBS曲线曲面反求算法用于叶片曲面的构造,完成叶片的计算机建模方法,有效地提高了此类曲面在实际生产中的设计精度。

期刊

NURBSCAD扭变曲面反求算法NURRBS CAD skew surface reverse algorithm

基于Dirichlet分布语言建模的信息检索技术研究

与本文相关的学术论文