低资源少数民族语言语音识别研究

被引量 : 0次 | 上传用户：zhangchi900207

【摘要】

：

少数民族语言进行语音识别时存在训练数据稀疏导致识别率低的问题。该文在对低资源的柯尔克孜语识别时,采用交叉语种的CMN(convolutional maxout networks)构建声学模型,使用

【作者】

：

孙杰吾守尔·斯拉木热依曼·吐尔逊努尔买买提·尤鲁

【机构】

：

新疆大学信息科学与工程学院; 昌吉学院物理系;

【发表日期】

：

2004年期

【关键词】

：

语音识别少数民族语言上下文相关音素映射数据驱动方式卷积maxout网络

【基金项目】

：

国家重点基础研究发展计划(973计划No.2014CB340506);国家自然科学基金项目(No.61433012;No.61363063);新疆维吾尔自治区重点实验室项目(2015KL013)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

少数民族语言进行语音识别时存在训练数据稀疏导致识别率低的问题。该文在对低资源的柯尔克孜语识别时,采用交叉语种的CMN(convolutional maxout networks)构建声学模型,使用同一语系资源丰富的维吾尔语语料和反转dropout正则化方法对CMN进行预训练,鉴于两种语言的相似性,基于数据驱动方法创建音素映射对标注待识别语种的数据,并用柯尔克孜语数据对CMN进行微调。实验结果表明,所提CMN模型较CNN模型字错误率(WER)有19.8%的相对降低;使用元音敏感的上下文音素映射集对识别出的音素序列进行解码,字错误率进一步降低。

其他文献

低资源少数民族语言语音识别研究

与本文相关的学术论文