语言模型训练语料处理方法及解码词典的设计

被引量 : 0次 | 上传用户：yahoo

【摘要】

：

语言模型是大词汇量连续语音识别系统的核心模块,其性能受建模所用训练语料的影响很大。本文基于自然语言处理技术,设计并实现了一个针对汉语语音识别的专用分词系统。同时,

【作者】

：

林小俊田浩王馨浩杜蕴璇许敏吴玺宏迟惠

【发表日期】

：

2005年期

【关键词】

：

语言模型训练语料分词

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语言模型是大词汇量连续语音识别系统的核心模块,其性能受建模所用训练语料的影响很大。本文基于自然语言处理技术,设计并实现了一个针对汉语语音识别的专用分词系统。同时,针对原有解码词典与分词结果存在不匹配的问题, 提出了一种将分词、语言模型训练及解码置于一个通用词典框架之下的新设计方案。最后,基于语言模型的分支度、以及语音识别结果对上述处理方法进行评价,取得了较好结果。

其他文献

频道包装对频道形象的影响

在“包装”和“形象”前面加上频道二字,虽然意思也很好理解,但它确实算得上是个新名词,其历史在国内电视界不过五六年时间,标志当属中央电视台第一次推出的“传承文明沟通

期刊

频道包装电视包装频道形象

气体与硅油术中玻璃体填充用于黄斑裂孔性视网膜脱离的效果对比分析

目的探讨气体与硅油术中玻璃体腔填充用于黄斑裂孔性视网膜脱离患者临床疗效差异。方法选择该院2008年1月至2014年12月收治的行黄斑裂孔性视网膜脱离术患者60例,分为硅油组和

期刊

气体硅油类玻璃体视网膜穿孔视网膜脱离治疗结果

废弃塑料包装资源绿色高值化解决方案的持续创新(五)

提出了废弃塑料包装资源绿色高值化解决方案的持续创新的内涵,定义了"绿色高值化";研究了终结塑料寿命周期废弃塑料包装资源绿色高值化解决方案的持续创新;研究了废弃塑料包

期刊

废弃塑料包装再生资源绿色高值化解决方案研究

苹果酸中马来酸和富马酸的HPLC法测定

本文提出了用高效液相色谱法测定苹果酸样品中的马来酸及富马酸含量。由于富马酸是由各种不同方法生产的食用苹果酸(作添加剂用)中的固有杂质,因此天然苹果汁中富马酸的含量

期刊

富马酸酸含量马来酸稀硫酸溶液

对应用型本科院校实行大类培养模式的思考——以C校为例

通过对应用型本科院校实行大类培养情况的个案分析，指出应用型本科院校只有紧密结合当地实际和学校的办学定位，有选择地实行大类培养，科学制订实施方案，才能“扬大类培养之长、避

期刊

应用型本科院校大类培养

湖南地域分工与产业空间布局的理性思考

改革开放后，尤其是进入新世纪以来，我国区域经济进入快速发展时期。随着全球经济一体化和国际产业分工的调整，区域经济分工与格局、产业结构调整与空间布局都在发生重大变化。目

期刊

产业结构调整空间布局分工地域理性湖南区域经济发展全球经济一体化城镇化建设农业产业化

基于DEA的国家创新能力分析

在OECD的国家创新系统结构模型的基础上,分析了影响国家创新能力的关键因素,根据这些因素选定评价国家创新能力绩效的评价指标,以对某一国家的集成创新能力的投入产出效率进

期刊

国家创新能力DEA方法创新绩效集成创新

讲好故事:新闻叙述的策略

讲故事原本是文学家最擅长的本领,千百年来历代作家积累了异常丰富的讲故事经验,这是新闻工作者汲取叙事智慧的宝库。记者遵循了客观、真实叙述的前提后,在通讯、特稿和深度

期刊

讲故事新闻文学性新闻真实性

语言模型训练语料处理方法及解码词典的设计

其他学术论文