论文部分内容阅读
摘 要:在传输的过程中无线语音信号往往会受到噪声干扰,所以,在语音通信中降噪一直是大家重点研究的一个课题。本文研究和综合分析了语音降噪的关键技术、三大基本工具与两大基础理论,意在提升无线语音传输的质量。
关键词:语音通信;降噪;关键工具;关键技术
引言
语音是信息传递最重要的手段之一。在无线通信中,噪声不可避免地对有用语音产生影响,对带噪语音信号进行降噪处理是仍是当今语音通信中的一个重大课题。频谱减法、遗传算法、自适应滤波算法等,早在上世纪六十年代,就在相关学者对语音静噪处理的深入研究中提出来。语音降噪的过程如下图1所示:
1 无线语音噪声分类
目前还没有一种降噪处理技术能够完美处理任何噪声,因此对噪声进行分类并选择适用的降噪算法显得尤为重要。噪声是无法彻底消除的,因为噪声与纯净语音信号都属于随机信号。故而,我们只能尽可能地在语音降噪处理过程中提取出有用语音信号[1]。在进行降噪处理时,选择适用的技术很关键,但是必须先根据分析出的待处理语音中噪声的种类与特性,再作出选择。噪声的分类有很多种。一般而言,加性噪声与乘性噪声是无线通信系统中存在的两大类噪声。
1.1 乘性噪声
乘性噪声:卷积失真是乘性噪声的另一种称谓,它是指噪声在频域上同纯净语音信号存在相乘的关系,它是一种由于声场或信道特性的随机变化所引起的噪声。在实际中,乘性噪声可转化为加性噪声,如利用同态滤波变换,然后以加性滤波方式加以处理,便可处理乘性噪声。
1.2 加性噪声
加性噪声:在时域内,噪声对纯净通信信号的影响表现为两种语音信号的叠加。因此,在频域内有用语音信号和噪声也是叠加的。加性噪声,从噪声的来源来看,又可进一步分为无线通讯系统中的外部、内部噪声。通信系统各部件和元件是造成内部噪声的主要原因,而外部噪声则主要来自于信道。单频噪声、脉冲噪声(源于雷电、电火花感染、电力线感应等)和起伏噪声是加性噪声的三种基本分类。本文研究的是加性噪声。
2 降噪处理工具
本研究使用了目前应用较为广泛的三种降噪处理工具,分别为:Adobe Audition软件、VS99语音工作站与DSG—98 计算机语音分析系统。
2.1 Adobe Audition 软件
Adobe Audition软件具有强大的编辑、特效、混音等功能,支持128 條音轨、多种音频格式、多种音频特效,可有效地对音频文件进行修改、合并。该软件所含的降噪工具和声相修复工具可有效对噪声和语音进行调整。同时,Adobe Audition软件还设计有包括噪声降低器、爆音修复器和自动咔哒声消除器等一系列专门处理噪声的滤波器。
2.2 VS-99 语音工作站
VS-99是我国自主研发的一款语音信号处理系统。该系统能实时动态采集分析语音,利用VS-99系统中的降噪器和频域编辑功能,能够在语图观察的基础上将语音信号中的噪声进行降噪处理并把有用的语音信号放大,提高语音质量。
2.3 DSG—98 计算机语音分析系统
DSG—98 计算机语音分析系统是一款有通用微机构成的语音分析系统。该系统以FRFT算法为核心,提高了运算速度,还综合了语音处理、图像处理和计算机图形学等理论和处理技术,为语音分析探索了一条新路。综合来看,DSG—98 计算机语音分析系统具备低成本、高性能、多功能的优点。
3 语音降噪算法
语音降噪,也称语音增强。语音降噪的目的在于增强语音质量,其实现手段为将有用的语音信号在带噪语音中尽可能分离出来。
3.1 基于语音谱特征的谐波增强算法
利用带噪语音浊音段所具有的周期性的特性,可利用自适应梳状滤波器将语音分量提取出来,增加语音可懂度。梳状滤波器的实现形式如下:
在式中,s (n)代表输出信号,M为常数,Ck为滤波器系数, x (n)为输入信号,L为基音周期。从上式中可知,s (n)是输入信号的延时加权平均。周期性分量在这个平均过程中得以增强,但是其他非周期性分量受到抑制或消除[2]。由此可见,使用谐波增强法的关键是准确估计基音周期。各种基音估计算法可有效估计基音周期,但如果背景噪声过强,则难以准确估计基音周期。并且,由于基音发生变化,所以在过渡语音段中,也是难以准确估计基音周期的。
梳状滤波不仅有增强语音信号的效果,还可对噪声产生抑制的作用[3]。但如果同时对两个语音进行处理,准确估计基音周期也很困难,这时使用滤波方法增强语音的效果也差强人意。
3.2谱减法
语音降噪算法多种多样。谱减法因其原理简单、容易实现等优点成为语音降噪算法中较为常用的算法。在使用谱减法时,噪声满足以下三个假设条件:
1. 噪声为加性噪声,且都是高斯噪声。
2. 语音信号是短时平稳且独立于噪声的信号。
3. 因人耳对语音信号相位不敏感,故可用带噪语音信号的相位代替纯净语音信号的相位。
将x (n)表示为有用语音信号,d (n)表示为加性噪声,y (n)表示为带噪信号,则有如下(2)式:
带噪语音经加窗处理后如式(3):
其中0 ≤ n ≤ N-1,i为第i帧,n为样点数,N是帧长。相应的频域表示为:
k 是频谱的分离值,假设纯净语音信号与噪声信号不相关,从功率谱的角度出发则有:
若从幅度值的角度考虑,则有:
人耳对语音信号的频谱相位不敏感,其获取语音信号主要是通过获得频谱分量的幅度来实现的[4]。将原始语音信号的相位加入到降噪后的语音信号中,便可获得语音信号的估计值。由此,频谱减法公式一般化后为:
频谱减法的原理图如下:
频谱减法能够做到有效降噪并且该方法的算法简单,故获得广泛应用,但该方法也有其缺点。它主要包含两个方面的缺点:(1)传统频谱减法是依靠噪声端点检测的正确性来估计噪声的正确性。但是,当噪声水平高时,噪声端点检测算的的正确性并不高,于是降低了频谱减法的语音降噪效果;(2)在对噪声进行估计时,频谱减法求噪声均值。于是,在降噪的过程中,又会引入音乐噪声。然而,人耳对音乐噪声易产生疲劳,因此会降低人耳对语音的敏感度。
4.结束语
综上所述,Adobe Audition软件、VS99语音工作站以及DSG—98 计算机语音分析系统都可以有效对语音信号进行降噪。实践证明,传统频谱算法和谐波增强算法是两种比较高效的语音降噪算法。两种算法各有其优势与不足。在进行降噪处理时,要根据实际情况选取相应的算法。
参考文献:
[1]赵力. 语音信号处理. 北京:机械工业出版社 2003:272-273, 282-283.
[2]甄斌 “语音信号的增强相对谱滤波”,声学学报,Vol. 26 No. 3 pp252-258.
[3]樊养余 “加性噪声抵消的对称相关函数法”,数据采集与处理,Vol. 16 No. 3 pp343-347.
[4] 杨行峻,迟惠生等. 语音信号数字处理. 北京:电子工业出版社, 1995.
关键词:语音通信;降噪;关键工具;关键技术
引言
语音是信息传递最重要的手段之一。在无线通信中,噪声不可避免地对有用语音产生影响,对带噪语音信号进行降噪处理是仍是当今语音通信中的一个重大课题。频谱减法、遗传算法、自适应滤波算法等,早在上世纪六十年代,就在相关学者对语音静噪处理的深入研究中提出来。语音降噪的过程如下图1所示:
1 无线语音噪声分类
目前还没有一种降噪处理技术能够完美处理任何噪声,因此对噪声进行分类并选择适用的降噪算法显得尤为重要。噪声是无法彻底消除的,因为噪声与纯净语音信号都属于随机信号。故而,我们只能尽可能地在语音降噪处理过程中提取出有用语音信号[1]。在进行降噪处理时,选择适用的技术很关键,但是必须先根据分析出的待处理语音中噪声的种类与特性,再作出选择。噪声的分类有很多种。一般而言,加性噪声与乘性噪声是无线通信系统中存在的两大类噪声。
1.1 乘性噪声
乘性噪声:卷积失真是乘性噪声的另一种称谓,它是指噪声在频域上同纯净语音信号存在相乘的关系,它是一种由于声场或信道特性的随机变化所引起的噪声。在实际中,乘性噪声可转化为加性噪声,如利用同态滤波变换,然后以加性滤波方式加以处理,便可处理乘性噪声。
1.2 加性噪声
加性噪声:在时域内,噪声对纯净通信信号的影响表现为两种语音信号的叠加。因此,在频域内有用语音信号和噪声也是叠加的。加性噪声,从噪声的来源来看,又可进一步分为无线通讯系统中的外部、内部噪声。通信系统各部件和元件是造成内部噪声的主要原因,而外部噪声则主要来自于信道。单频噪声、脉冲噪声(源于雷电、电火花感染、电力线感应等)和起伏噪声是加性噪声的三种基本分类。本文研究的是加性噪声。
2 降噪处理工具
本研究使用了目前应用较为广泛的三种降噪处理工具,分别为:Adobe Audition软件、VS99语音工作站与DSG—98 计算机语音分析系统。
2.1 Adobe Audition 软件
Adobe Audition软件具有强大的编辑、特效、混音等功能,支持128 條音轨、多种音频格式、多种音频特效,可有效地对音频文件进行修改、合并。该软件所含的降噪工具和声相修复工具可有效对噪声和语音进行调整。同时,Adobe Audition软件还设计有包括噪声降低器、爆音修复器和自动咔哒声消除器等一系列专门处理噪声的滤波器。
2.2 VS-99 语音工作站
VS-99是我国自主研发的一款语音信号处理系统。该系统能实时动态采集分析语音,利用VS-99系统中的降噪器和频域编辑功能,能够在语图观察的基础上将语音信号中的噪声进行降噪处理并把有用的语音信号放大,提高语音质量。
2.3 DSG—98 计算机语音分析系统
DSG—98 计算机语音分析系统是一款有通用微机构成的语音分析系统。该系统以FRFT算法为核心,提高了运算速度,还综合了语音处理、图像处理和计算机图形学等理论和处理技术,为语音分析探索了一条新路。综合来看,DSG—98 计算机语音分析系统具备低成本、高性能、多功能的优点。
3 语音降噪算法
语音降噪,也称语音增强。语音降噪的目的在于增强语音质量,其实现手段为将有用的语音信号在带噪语音中尽可能分离出来。
3.1 基于语音谱特征的谐波增强算法
利用带噪语音浊音段所具有的周期性的特性,可利用自适应梳状滤波器将语音分量提取出来,增加语音可懂度。梳状滤波器的实现形式如下:
在式中,s (n)代表输出信号,M为常数,Ck为滤波器系数, x (n)为输入信号,L为基音周期。从上式中可知,s (n)是输入信号的延时加权平均。周期性分量在这个平均过程中得以增强,但是其他非周期性分量受到抑制或消除[2]。由此可见,使用谐波增强法的关键是准确估计基音周期。各种基音估计算法可有效估计基音周期,但如果背景噪声过强,则难以准确估计基音周期。并且,由于基音发生变化,所以在过渡语音段中,也是难以准确估计基音周期的。
梳状滤波不仅有增强语音信号的效果,还可对噪声产生抑制的作用[3]。但如果同时对两个语音进行处理,准确估计基音周期也很困难,这时使用滤波方法增强语音的效果也差强人意。
3.2谱减法
语音降噪算法多种多样。谱减法因其原理简单、容易实现等优点成为语音降噪算法中较为常用的算法。在使用谱减法时,噪声满足以下三个假设条件:
1. 噪声为加性噪声,且都是高斯噪声。
2. 语音信号是短时平稳且独立于噪声的信号。
3. 因人耳对语音信号相位不敏感,故可用带噪语音信号的相位代替纯净语音信号的相位。
将x (n)表示为有用语音信号,d (n)表示为加性噪声,y (n)表示为带噪信号,则有如下(2)式:
带噪语音经加窗处理后如式(3):
其中0 ≤ n ≤ N-1,i为第i帧,n为样点数,N是帧长。相应的频域表示为:
k 是频谱的分离值,假设纯净语音信号与噪声信号不相关,从功率谱的角度出发则有:
若从幅度值的角度考虑,则有:
人耳对语音信号的频谱相位不敏感,其获取语音信号主要是通过获得频谱分量的幅度来实现的[4]。将原始语音信号的相位加入到降噪后的语音信号中,便可获得语音信号的估计值。由此,频谱减法公式一般化后为:
频谱减法的原理图如下:
频谱减法能够做到有效降噪并且该方法的算法简单,故获得广泛应用,但该方法也有其缺点。它主要包含两个方面的缺点:(1)传统频谱减法是依靠噪声端点检测的正确性来估计噪声的正确性。但是,当噪声水平高时,噪声端点检测算的的正确性并不高,于是降低了频谱减法的语音降噪效果;(2)在对噪声进行估计时,频谱减法求噪声均值。于是,在降噪的过程中,又会引入音乐噪声。然而,人耳对音乐噪声易产生疲劳,因此会降低人耳对语音的敏感度。
4.结束语
综上所述,Adobe Audition软件、VS99语音工作站以及DSG—98 计算机语音分析系统都可以有效对语音信号进行降噪。实践证明,传统频谱算法和谐波增强算法是两种比较高效的语音降噪算法。两种算法各有其优势与不足。在进行降噪处理时,要根据实际情况选取相应的算法。
参考文献:
[1]赵力. 语音信号处理. 北京:机械工业出版社 2003:272-273, 282-283.
[2]甄斌 “语音信号的增强相对谱滤波”,声学学报,Vol. 26 No. 3 pp252-258.
[3]樊养余 “加性噪声抵消的对称相关函数法”,数据采集与处理,Vol. 16 No. 3 pp343-347.
[4] 杨行峻,迟惠生等. 语音信号数字处理. 北京:电子工业出版社, 1995.