汉语大词表N-gram统计语言模型构造算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:sinbala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了汉语大词表的N-gram统计语言模型构造技术,根据信息论的观点,给出了自然语言处理中各种应用中的统计语言建模的统一框架描述,提出了一种汉语大词表的Trigram语言模型构造算法。把构造的Trigram语言模型应用于大词表非特定人孤立词语音识别系统中,系统识别率达到82%。 In this paper, we propose the construction technique of N-gram statistical language model of Chinese grand lexicon. According to the theory of information theory, we give a uniform framework description of statistical language modeling for various applications in natural language processing. Table Trigram language model construction algorithm. The constructed Trigram language model is applied to large vocabularies non-specific isolated speech recognition system, the system recognition rate of 82%.
其他文献
提升学生身体素质,培养学生良好的运动能力和运动习惯,是现代体育教育的重要内容.在开展体育教学中,由于缺乏趣味性,学生参与体育运动的积极性普遍不高,对于这种情况需要教师
背景:  表皮生长因子受体酪氨酸激酶抑制剂(EGFR-TKIs),在晚期非小细胞肺癌(Non-Small Cell Lung Cancer,NSCLC)的治疗中占据了十分重要的地位。然而,原发以及快速发生的获得
摘 要:从某种角度上来说,女工群体在企业运行期间承担着巨大责任,而工会作为煤矿企业和女工展开沟通交流的基础载体,往往在企业发展中也占据着尤为重要地位。但根据相关调查却发现,因工会女工工作开展时间总体较短,所以各方面内容都存在着明显问题,致使企业根本无法掌握有效方式和方法来提高女工整体素质水平。在这种情况下,就需要企业能够充分认识到工会女工工作的重要性,不断创新完善工作手段,营造良好工作环境及氛围,
油菜是越冬作物,头年秋季播种,第二年初夏收获,中间经历一段低温的寒冬,因而自然形成冬前和春后两个生长高峰,冬前是以营养生长为主,春后是以生殖生长为主。其栽培管理要点,
目的:  依托三级甲等医院及高等医学院校的优质教学资源,构建由专业教师、医务人员、医学生组成的义工急救普及宣讲服务队,对公众开展急救培训并评价其效果,以期为后续的公众急
一九八○年福鼎县共种植矮架早3.5万亩,占油菜总面积的70%,平均亩产153斤,比1万亩的白菜型油菜亩产70斤,增产一倍多。在全面丰收的基础上,涌现出一批高产社队和高产田块。秦
摘 要:站台线路常常受到多种条件的制约,始终有人工进行清筛作业,不能对清筛机械加以充分的利用,但是人工清筛往往无法确保道床石碴具有足够的排水性与清洁度。线路经过一定时间的运行便会发生一定的板结翻浆问题,此时便要多次进行人工维护线路,将会造成大量人力物力的浪费,而使用清筛机械能够使线路长期符合运行要求。对此本文对利用大型养路机械实现站台清筛的前期准备与施工方案进行分析,以期对相关工作人员有所借鉴作用
数学是一门比较复杂的学科,能够有效地帮助学生强化自己的思维,突破学生自我学习的能力,所以教师需要对自己的教学方案进行进一步的改进,从而使中职数学呈现简单化的教学趋势
人性化是人类社会发展中各个行业的一种需要和趋势。文章通过对图书馆管理中读者的人性化服务和管理内部本身的人性化研究,探析出以人为本的图书馆管理和服务的方法,从而希望
高中教材内容的深度、广度和能力要求都有了较大的变化,许多内容难度大、方法新,对理解和分析的能力要求较高.从而两极分化问题极其突出,面对学习水平参差不齐的学生,促使全