基于噪声估计和掩蔽效应的语音增强

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:remine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字化的语音传送、控制和识别是信息社会的基本组成部分之一。但是语音信号在获取和传送途中,都会不可避免的受到各类噪声的干扰,不仅导致接收者听到的语音质量下降,还会影响语音控制系统和识别系统的正常工作。语音数字信号处理技术已广泛地发展到了实用阶段,语音增强技术则发展为该阶段需要迫切解决的问题之一。语音增强的目的是消除噪声干扰和提高语音可懂度。针对不同类型的干扰噪声,要采用不同的语音增强策略,并且力图在抑制背景噪声的同时提高听者的舒适度。本文研究是建立在语音增强领域众多学者的优秀研究成果之上的,研究内容呈依次递进的关系,主要内容大致概括如下:1、简要阐述了语音增强技术的基本原理和常用方法,分析了各类噪声的性质和对语音的污染情况。2、对于平稳噪声干扰情况,本文将二次平滑引入语音活动检测(VAD)算法中进行后置处理,改善了VAD法估计平稳噪声时出现部分偏差的情况,采用维纳滤波来代替谱减法估计纯净语音,避免了“音乐噪声”的产生。在兼顾了复杂度和处理效果的情况下,该算法可以准确的估计出噪声并取得较好的增强效果。用多种非平稳噪声对该改进算法进行适用性分析,结果表明该算法更适用于处理平稳噪声。3、对于非平稳噪声干扰这一复杂情况,本文研究分析了数据递归法(DDR),分别用vuvuzela、babble、train和car噪声对该算法进行仿真试验,验证了该算法处理噪声污染的有效性,同时也证实了本文改进的VAD方法对复杂度和有效性进行了较好的权衡。发现了适用于平稳噪声环境下的增强算法不一定适用于非平稳噪声,但适用于非平稳噪声环境下的增强算法一定适用于平稳噪声环境的规律。DDR算法的有效实现为后文理想二元掩蔽(IBM)算法的研究提供了支持。4、提高可懂度是语音增强的重要目的。本文研究分析了能够提高可懂度的IBM算法和谐波恢复(HR)算法。IBM算法是在DDR法估计噪声方差的基础上实现的,仿真结果验证了该算法提高语音可懂度的有效性。本文采用三级分频段处理来改进了HR算法改善了传统HR法卷积运算会产生频谱混叠的问题。将IBM算法处理后的增强输出语音作为本文改进HR法的输入信号进行二次增强处理,有效提高了语音可懂度。
其他文献
作为一种生物认证技术,说话人识别依靠着低成本、高安全性以及方便性等独特的优势,越来越受到研究人员的青睐,而在所有的与说话人识别相关的算法中,支持向量机算法由于其适合解决
随着互联网的快速发展,信息资源的规模迅猛增长,信息过载成为了当今社会的一个主要问题。由于用户从海量信息中提取有用的信息变得越发困难,针对个人的智能化推荐技术应运而
随着移动通信技术的发展和移动增值业务的全面展开,以辅助全球定位系统(Assisted Global Positioning System,A-GPS)为代表的辅助全球导航卫星系统(Assisted Global Navigati
随着电力骨干传输网承载业务量的爆炸式增长,网络规模的日益壮大及智能电网的发展,对光纤资源提出了大颗粒、高带宽的新要求。然而目前骨干传输网大量采用的SDH技术以其较低的
学位
圆柱形构件被广泛应用于航天航空、汽车制造、国防弹药等领域。由于在生产过程当中,容易造成气孔、夹杂等缺陷,影响着产品的最终使用性能。因此在产品生产或使用过程中需要对其
深度图像作为一种三维场景信息的表达方式在当今的计算机视觉系统中得到了广泛的应用,然而激光雷达、TOF相机、Kinect等各类深度传感设备所获得的深度图像往往并非完美,通常
目前国内3G技术已面向市场,它为广大消费者提供了更多集趣味性、娱乐性、业务性于一体的基于位置的服务。同时,蓬勃发展的物联网也为基于位置的服务提供了更广阔的应用空间,
无线传感器网络是一种由传感器节点构成的网络,可以使普通物体具有感知和通信的能力,在国防军事、环境监测、民用及工业等领域有着广阔的应用前景。但无线传感器电池目前存在
红外偏振与红外光强图像的融合作为热红外目标跟踪与识别的前端关键技术,在军用和民用领域都有着广泛应用。当前,两者的融合算法多为事先确定的,而实际应用中两者的差异特征是动