基于Dirichlet分布语言建模的信息检索技术研究

来源 :2008年全国理论计算机科学学术年会 | 被引量 : 0次 | 上传用户:lqylzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于多项式的一元语言模型不能表示文档中的突发(Burstiness)现象,而基于Dirichlet分布的语言模型能够较好地处理突发现象.本文分析和讨论了几种基于Dirichlet分布的语言模型,并以DCM模型为基础,分别对文档和查询项进行语言建模,然后采用KL-divergence方法来度量文档模型和查询项模型的相似度.在TREC数据集上的实验表明,与基本的模型相比较,采用DCM模型能够提高信息检索的平均精确度.
其他文献
【正】办公室是一个综合协调、服务、管理机构,处于协调机关各部门、连接领导和基层的枢纽地位,具有参谋、助手、协调、服务、督办等基本职能,担负着上情下达、下情上报、对
美国空、海军联合研制的“杰达姆”(JDAM)全天候精确制导炸弹系列,在上世纪末、本世纪初的几场局部战争中出尽了风头,可谓武器中的“明星”。在阿富汗进行的“持久自由”行动
期刊
【正】去年我台进行了大规模的机房改造,包括供配电系统的扩容,并安装了无功补偿设备,在节能降耗方面已经取得明显的效果,现就无功补偿方面的知识进行探讨。一、无功补偿基础
随着集成电路制造工艺进入超深亚微米阶段,静态功耗在微处理器总功耗中所占的比例越来越大,尤其是片上二级Cache。在开发新的低漏流工艺和电路技术之外,如何在体系结构级控制
如何减少DNA计算机在求解大型科学问题中以问题输入纯指数增长的DNA链数,已成为DNA计算机研究的重要内容。本文将分治策略应用于子集积问题的DNA分子计算中,提出一种求解子集积
火星撞地球般的骑勇大战进行到第三节还剩一分钟,勇士潮水一样的进攻已经让骑士疲态尽现。杰夫-格林切入篮下接到科沃尔从45度角三分线外的传球,杀向篮筐一个远距离滑翔单手
通过文献资料法、问卷调查法、数理统计法等研究方法对周口联营职业中专篮球的开展状况进行调查与分析,得出以下结论:周口联营职业中专篮球专业教师应当提高自己的教学能力和
【正】区辖北海市从她诞生之日起,就注定与沿海开放城市结缘,走在了中国对外开放的前沿。北海的广播电视事业也得风气之先,在过去的30年里,与时俱进,与科技并肩,走过了从无到
<正>1.我敬佩两种人:年轻时陪男人过苦日子的女人,富裕时陪女人过好日子的男人。2.我远离两种人:遇到好事就伸手的人,碰到难处就躲闪的人。3.我挂念两种人:相濡以沫的爱人,肝
期刊
本文首先介绍了扭变曲面CAD在国内外的发展情况和NURBS方法的概念,通过推导曲面初始二维数据向三维数据的转换关系,提出一种将NURBS曲线曲面反求算法用于叶片曲面的构造,完成叶片的计算机建模方法,有效地提高了此类曲面在实际生产中的设计精度。