论文部分内容阅读
随着计算机和人工智能的发展,语音信号处理已成为当今的一个研究热点。语音信号是一种复杂的非线性、非平稳信号,时频分析是分析和处理非平稳信号的有力工具,它揭示了信号在时间域与频率域的联合时频分布信息,利用时频分布,可以提取语音信号在特定时间特定频率所具有的特征信息,时频分析方法为语音信号处理的发展带来了新的生机。但是,语音信号常常会受到噪声的干扰,必须进行语音增强和语音端点检测,改善系统在含噪条件下的性能。传统的时频分析方法如短时傅立叶变换、Wigner-Ville分布等,它们分别存在着窗效应和交叉项的问题且都不是自适应的。本文研究了一种新的具有自适应性的时频分析方法Hilbert-Huang变换,并将其应用于语音信号处理中,本文的主要研究工作及其成果如下:1.研究了Hilbert-Huang变换的基本原理及其Hilbert-Huang变换中存在的问题,根据实际需要选用了合适的端点效应处理方法,并用改进后的Hilbert-Huang变换对语音信号进行了时频分析,实验中与短时Fourier变换、Wigner-Ville分布、Choi-Williams分布进行了比较,仿真结果表明该方法可以获得语音信号更为精细的时频结构。2.利用Hilbert谱和边际谱可以精确地区分出同一个字不同声调的时频分布的不同,本文利用同一个字不同声调的Hilbert边际谱能量的变化情况建立了M-距离,对同一个字不同声调下的语音信号进行了识别,初步试验显示了此方法的有效性。3.提出了一种基于Hilbert-Huang变换和听觉掩蔽的语音增强算法,对高频的IMF分量进行了听觉掩蔽处理,仿真实验结果表明本文算法降低了语音失真测度值,提高了语音信号的信噪比、清晰度及可懂度。4.研究了Teager能量算子和双门限端点检测的原理,针对Teager能量算子更为合理地反映信号能量的变化,并对调幅或调频信号具有更好的适应性,而IMF分量符合此特性的特点,因此提出了一种基于EMD和改进双门限的语音端点检测算法,仿真实验结果表明本算法在低信噪比情况下具有良好的端点检测性能。