语言模型训练语料处理方法及解码词典的设计

被引量 : 0次 | 上传用户:yahoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言模型是大词汇量连续语音识别系统的核心模块,其性能受建模所用训练语料的影响很大。本文基于自然语言处理技术,设计并实现了一个针对汉语语音识别的专用分词系统。同时,针对原有解码词典与分词结果存在不匹配的问题, 提出了一种将分词、语言模型训练及解码置于一个通用词典框架之下的新设计方案。最后,基于语言模型的分支度、以及语音识别结果对上述处理方法进行评价,取得了较好结果。
其他文献
在“包装”和“形象”前面加上频道二字,虽然意思也很好理解,但它确实算得上是个新名词,其历史在国内电视界不过五六年时间,标志当属中央电视台第一次推出的“传承文明沟通
目的探讨气体与硅油术中玻璃体腔填充用于黄斑裂孔性视网膜脱离患者临床疗效差异。方法选择该院2008年1月至2014年12月收治的行黄斑裂孔性视网膜脱离术患者60例,分为硅油组和
提出了废弃塑料包装资源绿色高值化解决方案的持续创新的内涵,定义了"绿色高值化";研究了终结塑料寿命周期废弃塑料包装资源绿色高值化解决方案的持续创新;研究了废弃塑料包
本文提出了用高效液相色谱法测定苹果酸样品中的马来酸及富马酸含量。由于富马酸是由各种不同方法生产的食用苹果酸(作添加剂用)中的固有杂质,因此天然苹果汁中富马酸的含量
通过对应用型本科院校实行大类培养情况的个案分析,指出应用型本科院校只有紧密结合当地实际和学校的办学定位,有选择地实行大类培养,科学制订实施方案,才能“扬大类培养之长、避
改革开放后,尤其是进入新世纪以来,我国区域经济进入快速发展时期。随着全球经济一体化和国际产业分工的调整,区域经济分工与格局、产业结构调整与空间布局都在发生重大变化。目
在OECD的国家创新系统结构模型的基础上,分析了影响国家创新能力的关键因素,根据这些因素选定评价国家创新能力绩效的评价指标,以对某一国家的集成创新能力的投入产出效率进
讲故事原本是文学家最擅长的本领,千百年来历代作家积累了异常丰富的讲故事经验,这是新闻工作者汲取叙事智慧的宝库。记者遵循了客观、真实叙述的前提后,在通讯、特稿和深度