噪声环境下鲁棒语音识别技术的研究

来源 :东南大学 | 被引量 : 3次 | 上传用户：fspdgx

【摘要】

：

语音交流是人类最方便的交流方式。随着科技的发展,以语音识别技术为核心的人机交互方式日益流行起来。经过六十多年的发展,语音识别技术已经有了极大的提升,在安静环境下,语

【作者】

：

唐於烽

【出处】

：

东南大学

【发表日期】

：

2018年01期

【关键词】

：

语音识别语音增强听觉掩蔽谐波恢复帧信噪比深度神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音交流是人类最方便的交流方式。随着科技的发展,以语音识别技术为核心的人机交互方式日益流行起来。经过六十多年的发展,语音识别技术已经有了极大的提升,在安静环境下,语音识别系统的性能接近人类水平,而在有噪声干扰的情况下,语音识别系统的识别准确率大打折扣。在噪声环境下提高语音识别系统的鲁棒性已经成为语音识别技术投入大规模使用的关键之一。本文主要针对噪声环境下语音识别系统性能下降的情况,使用语音增强算法对输入语音进行降噪处理,提升输入语音的质量以提高语音识别系统的鲁棒性。而传统意义上的语音增强算法会使语音产生畸变和失真,因此需要针对自动语音识别系统的特性对语音增强算法进行改进。本文主要的工作有:(1)研究了基于人耳听觉掩蔽效应和谐波恢复原理的改进维纳滤波算法。首先研究了人耳的听觉掩蔽效应,并对掩蔽阈值的求解方法进行了介绍,其次对最小值统计噪声估计(Minimum Stasistics,MS)算法和基于最小值约束的递归平均噪声估计方法(Minima-Controlled Recrsive Average,MCRA)进行了研究,然后提出改进方案,第一步,结合掩蔽阈值调整噪声能量谱的估计;第二步,使用谐波恢复原理,恢复丢失的语音成分;第三步,为了减少失真对输出语音以先验信噪比为准则进行后处理。最后,经过实验仿真验证,本改进确能提高语音质量。(2)研究了一种对数域MMSE幅度谱估计器的改进算法。首先研究了线性MMSE幅度谱估计器和对数域MMSE幅度谱估计器的原理,通过实验对比,发现对数域MMSE幅度谱估计器有更好的效果。然后针对对数域MMSE幅度谱估计器处理后的语音仍存在较多残留噪声和语音畸变的情况,引入了帧信噪比,根据帧信噪比构造噪声控制因子,语音能量最小值控制因子和残留噪声抑制因子对对数域MMSE幅度谱估计器的增益函数进行改进。最后,通过实验仿真验证本章改进确实大幅度减少残留噪声和语音畸变。(3)研究了深度神经网络技术在语音增强算法上的应用。首先研究了一种基于深度置信网络的回归模型在语音增强算法的应用,训练出一个回归模型,并验证了其在不匹配噪声测试集上的效果。其次,着眼于该网络训练中构造的带噪语音信号与实际应用场景的差异,以及噪声库无法与实际场景中噪声环境的差异,参考语音识别中提高模型泛化能力的声音信号扰动策略,本文对噪声进行频率上的扰动,使有限的噪声具备尽可能多的特性,丰富训练集,增加模型的泛化能力;然后,考虑到不同频点对误差的权重有差别,使用先验信噪比构造了频率权重系数,对损失函数进行了改进,接下来对训练得到的网络权重参数进行分析研究,发现了网络参数存在较大的冗余,将网络进行稀疏化、剪枝和重训练;最后,在最新的语音识别框架CMU Sphinx和kaldi搭建的语音识别系统上对本文改进的所有语音增强算法的效果进行验证,与传统语音增强算法的效果进行对比,实验表明,针对语音识别特性改进的语音增强算法对自动语音识别系统在噪声环境下的性能有较大提升,其中基于神经网络的语音增强算法效果最佳。

其他文献

IP方案治疗35例复发和难治性非霍奇金淋巴瘤疗效分析

目的:观察IP方案治疗复发和难治性非霍奇金淋巴瘤的疗效和毒性反应。方法:对35例复发和难治性非霍奇金淋巴瘤患者采用异环磷酰胺(IFO)1.5g/m~2,静滴,第1～5天;美斯纳(Mesna)0.4

学位

化疗复发和难治性非霍奇金淋巴瘤IP方案

MT1-MMP在上皮性卵巢癌中的表达及临床意义

目的:研究膜型基质金属蛋白酶-1(membrane-type 1 matrix metalloproteinase,MT1-MMP)在上皮性卵巢癌组织中的表达,并检测微血管密度(microvessel density,MVD),探讨MT1-MMP

学位

卵巢肿瘤MT1-MMP侵袭转移血管生成预后

功能动作筛查和星状偏移平衡测试相关性的研究

目的：对上海申鑫足球俱乐部精英梯队运动员进行功能动作筛查和星状偏移平衡测试相关性的实验研究，为运动训练和预防损伤提供更多的参考信息。方法：上海申鑫足球俱乐部精英梯队运

期刊

功能动作筛查星状偏移平衡测试相关性

多重氢键调控四苯乙烯骨架在稀溶液中的荧光

在超分子化学领域,多重氢键作用因具有优良的定向性、动态可调节性和较高的结合强度,已被广泛应用于构筑功能性超分子自组装体。本论文基于经典的Hamilton受体与三聚氰酸/巴

学位

超分子化学多重氢键Hamilton受体自组装AIE四苯乙烯超分子网络化学传感器

生长抑素类似物抑制胆管癌细胞增殖的研究

目的:探讨生长抑素类似物奥曲肽（OCT）对人胆管癌细胞细胞株QBC939的抑制作用及可能的作用机制。方法: MTT法检测OCT对人胆管癌细胞株QBC939增殖的影响,流式细胞仪检测OCT对QBC9

学位

胆管癌生长抑素P27KIP1细胞周期裸鼠

西宁市商业中心演化研究

随着我国城市化进程的加快、城市经济和社会的快速发展,城市居民对商业服务的需求日益增长,城市商业中心出现了空前的繁荣。商业中心作为城市商业贸易的流通场所,是商品流通

学位

西宁市商业中心演化过程主要因素

某型船用柴油机曲轴概要设计及优化

曲轴是船用柴油机的重要零部件,其工作性能极大程度上决定了整个柴油机的工作性能。同时,也间接影响着整艘船舶的基本工作性能,可喻为船舶的“心脏”部件。所以,船用柴油机曲

学位

曲轴概要设计优化iSIGHT拓扑

基于iOS的“爱限免”应用的设计与实现

移动互联网的发展成为当下越来越热门的话题。与此同时各类手机APP应用的规模随着中国经济飞速发展而快速增长,人们在种类繁多的各类APP应用中难以全面的了解到其信息,而本款应用可以让用户更好的了解到各类APP信息。此应用类似于APP助手,是为了更好地帮助用户了解各种不同类型APP软件功能。基于iOS的“爱限免”软件APP是专门为苹果手机设计的,是可以免费下载的手机APP应用软件。本系统的编程环境是运行

学位

iOS爱限免XcodeIDEObjective-C

马克思恩格斯生态思想及当代价值

伴随科技与生产力的跃升,外部环境成为美好生活关注的问题,恶化的生态环境成为美好生活的真实困境。生态环境的可持续发展十分重要,提出要从全局着眼,顾及当代照顾长远。马恩

期刊

马克思恩格斯生态思想当代意义

涎腺恶性肌上皮瘤临床病理与基因表达的研究

目的:涎腺恶性肌上皮瘤(MME)也称为肌上皮癌,其生物学行为尚不清晰。本研究采用免疫组化技术探讨癌基因c-erbB-2、增殖细胞抗原(PCNA)与抑癌基因p53在涎腺恶性肌上皮瘤(MME)

学位

基因表达增殖细胞抗原c-erB-2p53免疫组化肌上皮瘤

噪声环境下鲁棒语音识别技术的研究

与本文相关的学术论文