基于LAS模型的中英文混杂语音识别研究

来源 :西北民族大学 | 被引量 : 0次 | 上传用户:ym_l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动语音识别是自然语言处理中一个重要研究领域。近年来随着深度神经网络的蓬勃发展,自动语音识别社区开始使用深度神经网络技术来处理语音识别任务。部分研究者把深度神经网络直接融合在基于HMM-GMM模型上形成HMM-DNN,另一部分研究者借鉴机器翻译领域的端到端的思想,直接构建端到端语音识别系统。端到端语音识别系统搭建相对比较简单,不需要繁杂的对齐与发音词典构建工作,展现出了良好的应用前景。在中文和英语这种拥有丰富数据资源的语言上,端到端语音识别模型性能已经接近基于HMM-DNN模型性能,但是对于中英混杂这一低资源的语音识别任务,端到端语音识别系统却没有获得很好的性能。本文在中英混杂数据有限的情况下,研究端到端语音识别的建模方法。主要关注两种端到端语音识别模型:连接时序分布(CTC)和基于注意力机制的编解码网络(LAS)。研究改善连接时序分布模型的编码器性能和改善基于注意力机制的编码器性能,并尝试结合两种模型来改善中英混杂语音识别性能。在低资源的中英混杂数据上,利用不同模型的优点来改善端到端模型的性能,从而提高语音识别准确率。本文以新加坡和马来西亚地区的中英文混杂语音作为研究对象,首先建立一个基于HMM-DNN的最优中英混杂语音识别系统作为对比系统。其次训练一个字符级循环神经网络语言模型辅助端到端模型的解码过程。在端到端模型方面,本文选取连接时序分布网络和基于注意力机制的编解码网络,首先向两个模型添加卷积神经网络的预输入网络来提升模型性能,降低GPU运存占用。其次在连接时序分布网络辅助注意力机制的混合结构中,从编码器结构、注意力机制类型、计划抽样参数以及模型超参数调整等多方面入手进行调优工作,最终在中英混杂数据集SEAME的两个测试集上,词错误率(WER)分别为24.4%和17.6%,和传统的基于HMM-DNN的语音识别系统的测试结果基本相同。
其他文献
肾形肾状线虫(Rotylenchulus reniformis)为固着性半内寄生线虫,其寄主范围很广泛,多发生在热带和亚热带地区。最近几年,国际间和省际间园林植物的调运越来越频繁,但也伴随着日
多纤维自保温页岩烧结材料是将无用的稻草进行加工,把其制作成所需粒径,在页岩中以页岩质量百分比(5%保持不变)添加粒径为4060目秸秆粉末作为造孔剂,同时把纤维增强材料(玄武岩纤维、海泡石纤维粉末、云母纤维粉末)分别按照页岩不同质量百分比添加到页岩中,再经过一定强度的挤压成型和一定程度的焙烧等工艺步骤,形成一种新型轻质微孔自保温墙体材料。与未添加纤维增强材料的植物纤维页岩自保温烧结材料相比其抗压强度
目的:利用数据挖掘对导师治疗心肾综合征用药规律进行分析,总结导师经验以及用药,提高临床疗效。方法:通过门诊跟师,利用宁夏宁夏中医医院暨中医研究院的门诊CHIS系统收集自2017年9月1日至2019年12月30日期间就诊于导师童安荣主任门诊诊断为“心肾综合征”治疗有效的患者处方。本次研究收集了导师治疗心肾综合征有效患者59例,并对59例患者利用IBM SPSS Statistics23、IBM SP
目的:本次实验通过组织贴壁法从人脐带组织中分离得到脐带间充质干细胞(Human umbilical cord mesenchymal stem cells,hUC-MSCs),采用沉淀法分离出外泌体(exosomes)并鉴定,探索人脐带间充质干细胞来源外泌体(Human umbilical cord mesenchymal stem cell exosomes,hUC-MSCs-exo)的提取与鉴
玛格丽特·尤瑟纳尔(Yourcenar Marguerite,1903-1987)是法国著名的小说家、诗人和戏剧家。她一生创作了5部长篇小说、3部短篇小说集、3部诗集、2部剧本,其中长篇小说《哈德
目的:探讨小儿在头部由正中位向侧位不同角度的偏转对经典喉罩(CLMA)通气效果和套囊内压力的影响。方法:选取我院于2019年2月到2020年2月入院的60例需进行耳部相关手术的患儿作为研究对象,按头部偏转角度分为A、B、C三组,A组(60°),B组(70°),C组(80°),每组各20例。对比三组头部偏转角度对CLMA通气效果、套囊压力及并发症的影响。结果:三组间偏侧位时各指标比较,偏侧潮气量(T
光是影响植物生长发育的重要环境因子。在设施生产中,光照不足的情况严重影响了蔬菜作物的生长发育及产量、品质形成。生产上多采用人工补光的方式来改善设施内光照条件。以
目的:研究FOXO4-DRI对大鼠体外退变衰老软骨细胞的影响,探讨FOXO4-DRI对大鼠体外退变衰老软骨细胞靶向促凋亡机制。方法:(1)取5周龄的SD大鼠关节软骨,通过胰蛋白酶及Ⅱ型胶原酶消化离心放入培养箱中培养,获得SD大鼠软骨细胞。(2)使用阿利新蓝、甲苯胺蓝染色以及Ⅱ型胶原蛋白免疫细胞化学染色鉴定获取的细胞(3)将实验分为2大组。对照组(ctrl组):第2代取自5周龄大鼠的软骨细胞。退变衰
本翻译报告选取成都记忆系列丛书之一《成都茶馆》的翻译实践为素材,基于切斯特曼的翻译模因论指导,探讨译者在翻译该类文本时对于三类模因所采取的翻译策略,进行总结和反思。原文本的作者为何小竹先生,他通过查询各方资料和实地走访,在书中记录了成都茶馆的发展和演变,讲述了茶馆与成都人民相互影响的故事。笔者通过广泛搜索,目前尚未发现国内有该作品的英译本。通过分析原文本特征,本报告总结了原文本所含的几类突出模因,
目的:脑膜炎(meningitis)是常见的中枢神经感染性疾病,细菌性脑膜炎(bacterial meningitis,BM)和病毒性脑膜炎(viral meningitis,VM)为最常见的两种脑膜炎。目前,基于代谢组学技术的脑膜炎研究报道非常少,本论文将联合非靶标和靶标代谢组学技术对儿童脑膜炎患者及对照组(control group,CG)的脑脊液(cerebrospinal fluid,CS