基于时延神经网络的语音识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wx1980_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展,基于时延神经网络(Time Delay Neural Network,TDNN)的语音识别已经成为主流方法之一,而目前的研究过程中仍然存在一些问题。一方面目前仍然缺乏对于TDNN加深的研究,以及如何更好地对提取时延神经网络不同时间尺度的上下文特征的研究;另一方面对于端到端语音识别来说,在低资源语音识别场景下容易遇到数据匮乏的问题,从而导致性能下降。针对以上的问题,我们的主要研究内容和成果如下:(1)提出基于随机深度的因子分解时延神经网络。传统的时延神经网络对于每一个上下文拼接层只采用一个权重矩阵进行特征提取,限制了对不同时间上下文特征的提取能力。针对这个问题,本文对提出在时延神经网络的每一个上下文拼接层后面加深。在加深的基础上,本文通过引入残差连接和随机深度的训练方式来增强模型的泛化能力。对于参数量增加的问题,本文提出了基于随机深度的因子分解时延神经网络,对加深的前馈神经网络层采用奇异值分解的结构进行初始化,并将其中一个权重矩阵限定为半正定的来保证训练的稳定。实验结果表明,在AMI和SWBD英文数据集上,本文提出的模型在性能优于优于传统的时延神经网络,且能达到与循环神经网络相当的结果,在实际应用中具有低时延、易收敛、高效计算等优点。(2)在基于端到端的低资源语音识别场景下,针对数据匮乏问题,在知识迁移上,本文提出采用单步权重迁移的方式进行知识迁移,在英语到英语、英语到捷克语的低资源场景下均取得了提升;在输出建模单元上,针对输出单元上文双音素数据匮乏的问题,本文提出采用一种适合低资源语音识别场景下的上文双音素绑定算法,在降低模型参数量的同时,也缓解了输出单元数据匮乏的问题;在声学建模上,本文提出基于卷积神经网络的随机深度因子分解时延神经网络,该网络在加深的前馈神经网络层中采用奇异值分解的结构进行初始化,并通过随机深度的训练方式、卷积神经网络的输入层增强模型在低资源场景下的泛化能力。最后,通过与目前一些主流的端到端模型相比,本文提出的算法在基于端到端的低资源语音识别场景上对模型参数量和模型性能均有显著提升。
其他文献
长柄扁桃(Amygdalus pedunculata Pall.)是一种新型的沙生木本油料植物,具有较高的经济价值和生态效益,是国家林业局拟在北方地区推广的经济治沙树种。长柄扁桃种子中种壳占种子质量的70%,且含碳量高、灰分低,是制备活性炭的优良原料。本论文以长柄扁桃壳为研究对象,采用三种不同方法研究长柄扁桃壳制备活性炭的工艺路线,对其吸附性能和结构特性进行表征,并将制备的活性炭用作双电层电容器的
连铸工艺是精炼钢水连续铸造成钢坯的生产工艺,主要包括回转台、中间包、结晶器、拉矫机等。在连铸生产过程中,铸坯在凝固过程中易形成中心偏析、疏松、缩孔等内部质量缺陷,
森林动态演替过程的计算模拟历来是森林生态学中的一个重要问题。不同于传统宏观式的模拟思路,本文提出了一种基于个体植物生长模型的、自下而上的模拟方法。论文首先构建了
百合是世界范围内重要的商品花卉,品种繁多。然而我国在百合育种中非常落后,目前切花、盆花生产以及园林绿化中所用的品种基本为国外品种;加之我国百合种球生产技术落后,致使
近年来空间探索事业不断发展,我国也积极的加入到空间探索的队伍中,在不久的将来将自主构建空间站。面向日趋繁重复杂的在轨操作任务,空间机械臂在其中扮演的角色越来越重要,
直线运动平台具有结构简单、精度高、推力大和响应快等优点,是IC制造设备、精密伺服机床、光学测量仪器等伺服性能要求较高应用场合的首选方案,具有广阔的应用前景。在精密运
木材胶黏剂是一类将木材与木材或其他材料的表面通过胶接成为一体的材料,主要用于纤维板、胶合板、夹心板、木塑复合板及木合金板等的制造。近几年,我国的木材加工所使用的胶黏剂主要以甲醛系胶黏剂为主,主要包括酚醛树脂胶(PF)、脲醛树脂胶(UF)、三聚氰胺-甲醛树脂胶,合称三醛胶。此类胶黏剂的使用性能优良,粘结强度高,是木材工业应用最多的一类胶黏剂,其产量占木材胶黏剂总产量约90%。现阶段,随着人们生活水平
过程感知信息系统的核心是业务过程模型。由于建模者的水平不同,而对业务过程进行建模也是较为复杂、易出错的,因此业务过程模型的质量相差很大。所以实施过程感知信息系统的企业必须对业务过程模型进行管理,并对业务过程模型的质量问题进行解决,而模型的质量问题包括:模型效率不高、缺乏可理解性、缺乏可维护性。如何提高模型质量对于实施过程感知信息系统的企业而言是一个必须解决的关键问题。本文关注的是如何提高模型质量。
台风是对海洋环境(包括河口、海湾等近岸海域)影响最为剧烈的短时间尺度的天气事件之一,其在短时间内显著地影响了河口区陆源物质的迁移、转化、交换、输运过程以及海洋生物与
近年来,直接甲醇燃料电池(DMFC)因其操作简单、污染低、能量密度高等优点,受到了广泛的关注。在DMFC各组分中,成本占比最高的是阳极催化剂,而常见的Pt基和Pd基催化剂因成本高、易中毒等缺点,限制了燃料电池的产业化。在碱性介质中,Pd基催化剂的抗中毒能力比Pt基催化剂好,故目前广泛地研究Pd基催化剂。本论文采用不同的还原剂来制备具有核壳结构的过渡金属粒子(TM=Ni,Co,Mn)修饰的还原氧化石