论文部分内容阅读
语音是人类最直接有效的通讯方式。在数字化信息时代蓬勃发展的今天,人们对语音信息处理和信息质量的要求随之增加,大大提高信息采样的成本。如何以更低的采样速率、更少的采样值完成对语音信号的压缩重构有着重要意义。压缩感知(Compressed sensing,CS)理论基于信号在某个变换域的稀疏性,以低于Nyquist采样定理的标准对信号进行采样且可以近乎精确的将原始信号恢复,意味着在语音信号压缩中对基于Nyquist采样定理传统方法的颠覆。在语音信号处理领域的发展中形成了一系列的信号处理方法和算法,并且已经得到了广泛的应用,如快速傅里叶变换(Fast Fourier Transform,FFT)、线性预测(Linear Prediction,LP)、矢量量化(Vector Quantization,VQ)以及经验模态分解(Empirical Mode Decomposition,EMD)等技术。将压缩感知理论基础与传统语音信号处理技术的各种特点联合,对其压缩重构的效果进行研究。本文主要工作和创新如下:(1)从信号的稀疏表示、观测矩阵和重构算法等方面展开,深入的学习并研究了压缩感知基本原理。并对语音信号的基本特征、常用的处理技术、编码方式等语音知识进行了基础研究。(2)结合压缩感知理论的特性和线性预测分析技术的优势,利用语音信号在线性残差域上的稀疏性以及语音信号特性,提出了一种在线性残差域上自适应分配观测点数的压缩感知算法。由语音信号特性可知,语音信号的帧之间可以通过能量来区分其重要性,所以根据每帧语音在整个语音段占用的能量比自适应分配观测点数,可以提高观测点数的利用效率,改善语音信号重构性能。(3)将压缩感知理论和经验模态分解方法相结合,用于语音信号压缩上,提出了一种基于经验模态分解的语音信号压缩感知算法。通过经验模态分解方法将语音信号分解,可得语音信号的本征模式函数信号分量。经实验证明了本征模式函数信号分量在常规的DCT域有更好的稀疏性。结合压缩感知理论基础分别对各个信号分量进行观测抽样,以实现语音信号的更好的压缩和重构效果。