【摘 要】
:
基于多项式的一元语言模型不能表示文档中的突发(Burstiness)现象,而基于Dirichlet分布的语言模型能够较好地处理突发现象.本文分析和讨论了几种基于Dirichlet分布的语言模型
【机 构】
:
国防科技大学计算机学院,湖南,长沙,410073
【出 处】
:
2008年全国理论计算机科学学术年会
论文部分内容阅读
基于多项式的一元语言模型不能表示文档中的突发(Burstiness)现象,而基于Dirichlet分布的语言模型能够较好地处理突发现象.本文分析和讨论了几种基于Dirichlet分布的语言模型,并以DCM模型为基础,分别对文档和查询项进行语言建模,然后采用KL-divergence方法来度量文档模型和查询项模型的相似度.在TREC数据集上的实验表明,与基本的模型相比较,采用DCM模型能够提高信息检索的平均精确度.
其他文献
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
导流板是一种保护冲刷河道河床的技术。它能够改变水流的流向并能显著地减少弯道水流中的次生水流,从而解决了弯道中凹岸冲刷,凸岸淤积的问题。本研究运用数值模拟和物理试验相
随着大片纷纷上映落定,今年的贺岁档已经过去大半。如果不拘泥于某一部影片,你会发现今年贺岁档有一个很有趣的现象——“男色”当道。无论国内国外,越来越多的目光都投给了
本研究介绍美国和日本在太平洋海啸预警系统和海啸预报基础研究方面的新进展。结合我国海域地震带的特点,提出我国的海啸预警系统研究需关注的重点海域和急需解决的关键技术问
通过对不同厚度层的水垢进行X 射线分析,发现了任何时候水垢都包含有两种不同结晶结构形态的CaCO3 组成:一种是六方晶结构(方解石),另外一种是斜方晶结构(文石),一般来讲六方晶是主体
前言 圣经中提到的第一种疾病是鼠疫。在1994年印度的鼠疫流行前,记载了全世界3次大的鼠疫流行:6世纪的Justinian鼠疫、14世纪的黑死病和最近的20世纪的大流行。自1944年至1
2012年12月6日,中国翻译协会授予八十五岁的文洁若女士“翻译文化终身成就奖”。文洁若1950年毕业于清华大学外国语文学系,精通日语、英语,曾任职于三联书店和人民文学出版社
Kruskal 和Zabusky 提出的计算孤立子的方法在孤立子理论的发展过程中起了重要作用,但是大量的数值结果表明,即使在满足线性稳定性的参数条件下,该方法也会出现非线性不稳定性的
本研究将介绍对于高速铁路火车流体分析的方法与计算结果,并由流体力学计算的结果,分析车头与集电弓罩的噪音问题。对于噪音的预测,应用数值方法在计算时间与计算资源的需求上都
出任中粮董事长的第六年,宁高宁把抽了三十五年的烟给戒了。 “因为这几年来我觉得吸烟越来越不合潮流,被人歧视,惹人讨厌。”宁高宁是一个紧跟时代的人,从18岁高中毕业,到后来下乡插队、征兵入伍、考大学、出国读MBA,在人生的每一个重要节点上,他的履历都与时代的节拍严丝合缝。 2004年12月28日,46岁的宁高宁“空降”中粮集团时,他的任务之一就是给这家老牌国企拧紧发条,跟上全球化的节奏。此时,中