基于深度神经网络的语音增强方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:sss03157017633
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能领域的快速发展,语音交互技术在现实生活中的应用越来越广泛。然而,语音信号非常容易受到周围环境中噪声的干扰,从而导致语音交互中的延时及错误识别等问题。语音增强技术可以有效提升语音质量和可懂度,是语音通信、语音识别等技术的重要前端信号处理技术。语音增强技术可大致分为两类:一是传统的基于数字信号处理的增强方法;二是基于有监督学习的增强方法。传统增强方法是语音增强技术的基础,具有重要研究意义。而基于深度学习的语音增强方法在大数据背景下取得了显著的效果。因此,本文将基于深度神经网络的语音增强算法作为主要研究对象,同时结合传统语音增强方法,旨在提高语音增强算法的性能。主要研究内容如下:首先,本文假设语音信号的傅里叶变换系数的幅度谱服从Chi分布,提出了Chi分布下改进的基于听觉感知广义加权的贝叶斯估计器,该估计器在去噪效果上优于传统的贝叶斯估计器。但是与平稳噪声相比,改进的贝叶斯估计器对非平稳噪声的处理效果仍不够理想。基于深度神经网络的语音增强方法虽然针对非平稳噪声效果较好,但是网络的训练过程耗时耗力。有实验证明,在深度神经网络训练阶段,使用经过增强的特征作为输入特征,会比原始特征实现更好的效果。而且经过贝叶斯估计器增强过的带噪语音信号残留的噪声类型也相对统一,在一定程度上可以减少网络训练时间和数据量。所以,本文综合二者的优点,接着提出了改进的贝叶斯估计器与深度神经网络相结合的语音增强算法。仿真实验结果表明联合的新型网络结构比单独两种算法增强效果更佳。最后,针对深度神经网络训练阶段使用的最小均方误差(Minimum Mean Square Error,MMSE)代价函数对非平稳噪声处理效果不理想的不足,本文提出采用最小误差熵(Minimum Error Entropy,MEE)代价函数代替传统MMSE代价函数。将MEE代价函数加入之前改进的语音增强算法,进而提出了一种基于MEE优化准则的联合Chi分布下基于听觉感知广义加权的贝叶斯估计器与深度神经网络的语音增强方法。通过对比实验证明了此改进方法的有效性。
其他文献
背景:胃癌(gastric cancer,GC)是中国最常见的恶性肿瘤之一,在所有癌症中,其发病率居我国第二位,死亡率为第三位。由于早期诊断率低、分化程度低、转移率高,与其它肿瘤如肺癌、乳腺癌相比,胃癌的5年生存率近年来改善的不多。因此,胃癌依然是危害人类健康的主要肿瘤。HEF1(Human Enhancer of Filamentation 1)是接头蛋白CAS(Crk-associated s
对很多钢琴演奏者而言,除了日常枯燥的技术难点的学习,还要克服钢琴演奏时的紧张心情。音乐作品的完美呈现需要表演者将纯熟的演奏技巧、良好的心理素质和恰当的自我心理调控
矩阵算法是求解不含负回路的网络中所有顶点对之间最短路的有效算法之一,但当节点比较多时,计算的矩阵多,重复计算量大,降低了计算效率。为此,提出了一种优化的矩阵算法,该算
科技日报讯 如果你还认为单程火星之旅的宇航员招募注定只能铩羽而归,那现在可要大跌眼镜了。据英国《每日邮报》在线版9月10日消息称,荷兰“火星人”公司(Mars One)火星宇航员第
报纸
本文对由任意数目平面反射镜组成的光学系统转动时反射光线的变化进行研究,确立并论证了系统转动前、后反射光线的变化规律。
18世纪中叶,英国的约翰·斯诺使用空间分析方法来研究伦敦流行病的爆发,奠定了现代社会城市形态应用于解决城市问题的方法论基础。随着计算机计算速度的提高和大量数字化数据
药用植物染色作为中国传统植物染色的一个分支,其所具有的朴素的美感、淡薄的气息、隽永的文化内涵以及养性更养生的保健功效,恰好成为了中国人趋之若鹜的珍宝。随着现代人们
目的:探讨ARIMA乘积季节模型和Holt-Winters季节模型在我国梅毒月发病率预测中的应用价值。方法:以2005年1月至2015年12月梅毒月发病率数据为基础,运用SPSS 22.0和Eviews 8.0
集体主义强调国家、社会、集体、个人利益的协调性和一致性。一方面,集体关注每一位成员的当前利益和长远利益,并且将其成员的正当利益作为自身存在和发展的宗旨;另一方面,集
本文介绍了用刀口仪代替朗奇光栅用于大型光学镜面面形检验的新方法。论述了测量原理、计算方法,给出了实验结果。该方法可克服刀口、朗奇光栅法各自的缺点,使用灵活、方便、