基于MLE的未知文本内容预测模型优化

来源 :荆楚理工学院学报 | 被引量 : 0次 | 上传用户：zqtoo

【摘要】

：

未知文本内容预测是信息检索系统的重要功能，它通过文本化、分词、建模和预测四个步骤实现。其基本语言模型采用基于最大似然估计（MLE）的概率分布方法，在实际应用中，该方法存在着

【作者】

：

疏国会金鑫

【机构】

：

安庆职业技术学院图文信息中心,安庆职业技术学院电子信息系

【出处】

：

荆楚理工学院学报

【发表日期】

：

2012年9期

【关键词】

：

信息检索 MLE 内容预测高阶模型平滑处理

【基金项目】

：

安徽省高校教学质量与教学改革工程项目省级精品课程--网页设计与制作（皖教高[2009]9号No：26）,安徽省高等学校省级示范实验实训中心--计算机应用中心（皖教高[2008]4号No：37）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

未知文本内容预测是信息检索系统的重要功能，它通过文本化、分词、建模和预测四个步骤实现。其基本语言模型采用基于最大似然估计（MLE）的概率分布方法，在实际应用中，该方法存在着效率和有效性不足的问题，影响预测的精度。通过对传统方法的分析，发现传统模型中影响系统效率和有效性的主要原因是未知词丢失、条件概率忽略以及合理未知词组零概率等问题，针对这些问题给出了引入未知词项、高阶模型和平滑处理等优化策略，导出了优化模型，并标出了影响系统性能的其他因素和下一步努力的方向。

其他文献

乙肝病毒preS1抗原的临床应用价值

前S1蛋白（preS1）抗原为乙型肝炎病毒（HBV）外膜蛋白的重要组成成分，在病毒附着和侵入肝细胞的过程中起重要作用，是反映病毒复制的指标。本实验对preS1抗原进行检测，并与HBV血清标志物

期刊

PRES1抗原临床应用价值乙肝病毒乙型肝炎病毒(HBV)HBV血清标志物HBV-DNA乙型肝炎诊断检测结果

中国仪器仪表行业协会第六届二次理事（扩大）会议在深圳顺利召开

2012年3月10-12日,中国仪器仪表行业协会第六届二次理事（扩大）会议在深圳召开。来自全国仪器仪表行业的企业、科研院所以及有关行业组织的代表200余人参加了会议。

期刊

仪器仪表行业行业协会深圳中国行业组织科研院所企业

让小学英语“活”“动”起来

课程改革的核心环节是课堂实施，课堂实施的基本途径是教学，课堂教学是新课程改革的着力点，课堂教学改革的关键在于促进学生的发展，在教学实践中，我们力图通过教学和学习方式的转变，激活课堂教学，真正产生“课堂活起来，学生动起来”的景象。他们喜欢新鲜事物，对陌生语言的好奇心能激起他们对外语的兴趣。他们喜欢引起别人的注意，重视老师的表扬，不怕犯错，很少有羞怯感。他们的记忆力好，形象思维好，但缺乏理性思维，逻辑

期刊

小学英语课堂教学改革课堂实施学生教学资源新课程改革核心环节基本途径学习方式教学实践

开放式教育值得重视

前不久,麻省理工学院(MIT)传出好消息,这个学校计划在一年之内,把该校1800种课程全部免费上网,供全世界有志向学的人免费学习。这个

期刊

麻省理工学院理工科学校人文学科上网开放式教育课程计划课程设置免费教育好消息中国大学

膝关节游离体的关节镜诊治分析

经关节镜诊治膝关节游离体50例。术前确诊者经关节镜检查得到确诊,术前未确诊者也经关节镜检查证实。游离体均取出,伴发病也得到相应治疗,有效率达91.2%。认为关节镜诊治膝关

期刊

关节游离体关节镜

一种基于相位的立体匹配算法

立体匹配是立体视觉中最为关键的一步,对立体视觉具有举足轻重的作用。为了能快速地进行立体匹配,该文结合极线约束和同一点相位相同特性,提出了一种新的基于相位的立体匹配算法。该方法首先根据极线约束确定对应点所在极线,再根据四步相移法得到图像的包裹相位,然后根据合成频率的相位展开方法提取相位,最后在该极线上找到相位相同的对应点。实验证明,与传统的极线最小距离方法相比,大大提高了匹配速度。实验结果验证了算法

期刊

立体匹配极线约束相位展开合成频率四步相移法stereo matching epiplastra constraint phase unwrapp

机械设计中技术要求的正确选注

进行机械设计时，正确选注技术要求成为机械工程技术员极其重要的一环。要做到正确选注，主要从战略思考和技术操作两个层面进行。

期刊

技术要求尺寸公差几何公差表面粗糙度

基于多尺度小波变换的变步长LMS滤波算法

对LMS自适应算法、基于抽样函数的变步长LMS算法和基于多尺度小波变换的自适应滤波算法进行了研究,在此基础上把变步长LMS算法与多尺度小波变换相结合,产生了新算法。该算法

期刊

自适应滤波LMS算法变步长小波变换Matlab仿真adaptive filtering LMS algorithm variable step s

井口远程监控系统在雅克拉气田的应用

雅克拉气田地处塔克拉玛干沙漠北缘戈壁，自然环境条件苛刻，各单井井位分散。随着雅克拉气田持续开发，单井数量增加，距离处理站越来越远。原有井口无线监控系统受外界自然环境影响