【摘 要】
:
自动语音识别技术是可以使人与机器交流更加顺畅的关键技术之一。近年来随着深度学习技术的不断发展,语音识别的准确率得到了很大程度的提升。通过研究发现,充足且有效的训练数据可以使语音识别效果有很大的提升。例如英语和汉语普通话这样的数据资源充足的语言,语音识别的准确性已经达到了人的水平,但是很多语言的数据资源相对有限,这就导致这类语言在语音识别的研究上没有取得很好的进展。本文在藏语语音识别中对训练数据获取
论文部分内容阅读
自动语音识别技术是可以使人与机器交流更加顺畅的关键技术之一。近年来随着深度学习技术的不断发展,语音识别的准确率得到了很大程度的提升。通过研究发现,充足且有效的训练数据可以使语音识别效果有很大的提升。例如英语和汉语普通话这样的数据资源充足的语言,语音识别的准确性已经达到了人的水平,但是很多语言的数据资源相对有限,这就导致这类语言在语音识别的研究上没有取得很好的进展。本文在藏语语音识别中对训练数据获取有限的前提下,我们来研究藏语自动语音识别中使用深度神经网络的方法进行声学模型的建模。在声学模型的构建上面尝试着使用多任务学习的思想,通过多个任务联合训练,从而提高语音识别正确率,一定程度上缓解训练数据不足的问题。在对声学模型的多任务学习研究上面,我们选择藏语拉萨话作为研究对象,在声学模型深度神经网络的选取上,我们对时延神经网络进行了研究和尝试。为了探寻深度神经网络对藏语拉萨话语音识别的影响,我们首先建立基于TDNN-HMM的藏语拉萨话语音识别基线系统,然后针对模型建模能力和训练速度以及训练数据有限等问题,我们进行分析和研究,选择使用半正交因式分解TDNN结构进行藏语拉萨话声学模型的建模,实验结果表明,相比于基线系统,使用半正交因式分解TDNN-HMM声学模型在实验结果上面有1%的相对词错误率下降。在上述实验的基础上我们对藏语声学模型的多任务学习进行研究,为了对比本次声学模型多任务学习的结果,我们需要构建一个较好的单任务藏语拉萨话语音识别基线系统。在数据没有增加的前提下,我们尝试使用数据增强的方法来对训练数据进行处理,然后使用这些数据来进行模型的训练,构建基于半正交因式分解TDNN-HMM的藏语拉萨话基线系统。通过对藏语的了解,我们发现藏语和汉语的发音有很多相似的地方,因此我们选择使用多语言语音识别这一特殊的多任务学习方法,对藏语声学模型的多任务进行研究,通过对模型结构以及参数的调整,我们得到了最优的藏语拉萨话多任务声学模型,然后通过对藏语拉萨话单任务学习基线系统和和藏语拉萨话多任务学习进行实验对比,实验结果表明,相比于单任务学习的声学模型,多任务学习的声学模型在词错误率上面有1%~2%的相对减少。
其他文献
超低温冷却加工能够快速降低切削区的局部高温,提高刀具寿命,改善材料的切削性能,为钛合金等难加工金属材料的高质高效加工提供了一种有效方案。切削温度是切削加工中的重要
CO2驱油技术能够有效提高原油采收率。由于CO2在原油中的溶解度高于以甲烷为主的常规伴生气,CO2气窜后原油中存在着大量溶解态的CO2,增大分离器容积延长原油在分离器内停留时
环氧树脂(EP)是一类非常重要的聚合物材料,但是常规环氧树脂的耐热性不足。近年来,随着微电子行业的快速发展和对环境的日益关注,电子设备的小型化和无铅焊料在电子领域的应
β-兴奋剂(β-adrenergic agonist)是苯乙醇胺的一类衍生物。对动物体具有促进肌肉组织生长,影响脂肪含量,能提高动物组织的瘦肉率和增加瘦肉的产量。高残留的β-兴奋剂,会产生
可见光半导体光催化技术不仅具有反应条件温和、无毒无害、环境友好等优点而且可以直接利用太阳光作为能源,因此被认为是一种新型的绿色催化技术。可见光半导体光催化技术广
素质教育的相关行业在近几年得到了飞速发展,相关学术论坛发声频繁、交流会议也日益增加。2018年3月30日至31日,第七届全国素质教育论坛在成都举行,笔者担任活动口译志愿者,承担了部分交替传译、陪同翻译任务。在此次活动中,笔者承担的口译工作涉及汉英、英汉实践,因此本报告将从双向维度进行探索。完成这次任务后,笔者尝试从自身翻译实践出发,以吉尔精力分配模型为切入口,系统地剖析了自身表现,探索了翻译活动中
生物大分子液液分离相变(相变)是由于生物大分子的多价相互作用而导致大分子与周围溶液分离的现象。相变过程中,发生相分离的生物大分子会在周围液态体系中形成一种液滴状结
压裂技术是油气井增产、注水井增注重要方法,但压裂返排液中含大量难降解高分子聚合物和污染物,若不及时处理而进入生态循环,会破坏井场周围生态环境、影响周边地表水系统状
近年来,带有声边界条件的方程成为很多前辈关注的焦点.在前人的基础上,我们这篇文章主要研究的是带有记忆项,强阻尼和声边界条件的非线性粘弹性Kirchhoff型方程(?)这里的Ω是
矿区大规模的重型机械压实造成了严重的土壤退化,压实导致土壤内部孔隙排列重组,限制土壤水和养分的运移,容易造成水土流失、生态恶化等严重后果,对矿区的土地复垦工作带来很大难度。探讨水力特性在不同容重下的变化特征,对矿区复垦土壤恢复和保持土壤水文平衡具有重要意义。目前,矿区压实土壤的水力特性研究总体上不够深入,缺乏理论基础。本研究中,土壤样品采自中国平朔矿区安太堡露天煤矿排土场,在实验室制备了不同容重(