基于MLE的未知文本内容预测模型优化

来源 :荆楚理工学院学报 | 被引量 : 0次 | 上传用户:zqtoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
未知文本内容预测是信息检索系统的重要功能,它通过文本化、分词、建模和预测四个步骤实现。其基本语言模型采用基于最大似然估计(MLE)的概率分布方法,在实际应用中,该方法存在着效率和有效性不足的问题,影响预测的精度。通过对传统方法的分析,发现传统模型中影响系统效率和有效性的主要原因是未知词丢失、条件概率忽略以及合理未知词组零概率等问题,针对这些问题给出了引入未知词项、高阶模型和平滑处理等优化策略,导出了优化模型,并标出了影响系统性能的其他因素和下一步努力的方向。
其他文献
前S1蛋白(preS1)抗原为乙型肝炎病毒(HBV)外膜蛋白的重要组成成分,在病毒附着和侵入肝细胞的过程中起重要作用,是反映病毒复制的指标。本实验对preS1抗原进行检测,并与HBV血清标志物
2012年3月10-12日,中国仪器仪表行业协会第六届二次理事(扩大)会议在深圳召开。来自全国仪器仪表行业的企业、科研院所以及有关行业组织的代表200余人参加了会议。
课程改革的核心环节是课堂实施,课堂实施的基本途径是教学,课堂教学是新课程改革的着力点,课堂教学改革的关键在于促进学生的发展,在教学实践中,我们力图通过教学和学习方式的转变,激活课堂教学,真正产生“课堂活起来,学生动起来”的景象。他们喜欢新鲜事物,对陌生语言的好奇心能激起他们对外语的兴趣。他们喜欢引起别人的注意,重视老师的表扬,不怕犯错,很少有羞怯感。他们的记忆力好,形象思维好,但缺乏理性思维,逻辑
前不久,麻省理工学院(MIT)传出好消息,这个学校计划在一年之内,把该校1800种课程全部免费上网,供全世界有志向学的人免费学习。这个
经关节镜诊治膝关节游离体50例。术前确诊者经关节镜检查得到确诊,术前未确诊者也经关节镜检查证实。游离体均取出,伴发病也得到相应治疗,有效率达91.2%。认为关节镜诊治膝关
立体匹配是立体视觉中最为关键的一步,对立体视觉具有举足轻重的作用。为了能快速地进行立体匹配,该文结合极线约束和同一点相位相同特性,提出了一种新的基于相位的立体匹配算法。该方法首先根据极线约束确定对应点所在极线,再根据四步相移法得到图像的包裹相位,然后根据合成频率的相位展开方法提取相位,最后在该极线上找到相位相同的对应点。实验证明,与传统的极线最小距离方法相比,大大提高了匹配速度。实验结果验证了算法
进行机械设计时,正确选注技术要求成为机械工程技术员极其重要的一环。要做到正确选注,主要从战略思考和技术操作两个层面进行。
对LMS自适应算法、基于抽样函数的变步长LMS算法和基于多尺度小波变换的自适应滤波算法进行了研究,在此基础上把变步长LMS算法与多尺度小波变换相结合,产生了新算法。该算法
雅克拉气田地处塔克拉玛干沙漠北缘戈壁,自然环境条件苛刻,各单井井位分散。随着雅克拉气田持续开发,单井数量增加,距离处理站越来越远。原有井口无线监控系统受外界自然环境影响
介绍了污水处理控制系统的总体结构以及控制系统的底层网络结构。该控制系统的运行效果显著,污水处理效果达到国家相应标准,降低了污水处理厂主要耗电设备的耗电量,同时降低了工作人员的劳动强度。