论文部分内容阅读
语音信号是人类交流过程中形成的一种特殊的音频信号,是人类思维的一种依托。语音信号处理是数字信号处理和语音学等学科的交叉学科,受到这些学科的技术影响也随学科的发展而进步。奈奎斯特采样定理是现阶段数字信号处理普遍采用和遵循的基本理论。随着移动互联网等的快速发展,语音业务也大幅增加,用传统奈奎斯特采样将会获得庞大的采样数据,这给信号的传输和存储带来了巨大压力。如果能有效降低传输和存储所需的数据量,不仅能够缓解硬件设备的压力,还能够降低时延,提高信息传输的整体效率。2012年,麻省理工学院(Massachusetts Institute of Technology,MIT)四位研究员提出了一种新的数字信号处理算法——稀疏快速傅里叶变换(Sparse Fast Fourier Transform,SFFT)。因为该算法拥有编码复杂度低、传输采样点少、编解码互相独立等优点,因此在语音信号压缩传输过程中可以达到数据压缩比高、分段信噪比较高的要求。为了突出展现SFFT算法的压缩处理效果,本文同时引入当前比较流行的压缩感知(Compressed Sensing,CS)算法,并进行分段信噪比、数据压缩比的量化效果的对比,同时采用语音质量感知评价(Perceptual Evaluation of Speech Quality,PESQ)对两种算法重构的语音信号进行质量评价。本文首先介绍了语音信号方面的理论知识,了解了语音信号的产生及特性、冗余的类型及压缩方法、语音信号的感知及编码等内容,为语音信号的压缩重构工作提供了理论基础。其次深入学习研究了近年来兴起的两种稀疏信号处理算法:SFFT算法和CS算法,并对SFFT算法中滤波器的设计做了改进。由于原始SFFT算法的滤波器在通带和阻带都有较大的纹波,运算过程中存在一定的频谱泄露,所以算法需要进行迭代处理来提高算法精度;改进算法中采用道尔夫-切比雪夫滤波器,其通带和阻带更加平滑,且通带到阻带的变化也比较迅速,算法运算过程中几乎没有频谱泄露,因此,改进后的算法不需要进行迭代处理,提高了SFFT算法的运行效率。在CS算法的研究中,详细论述了信号的多种稀疏表示和重构的方法,并从中选取了比较有代表性的、复杂度较低的离散余弦变换稀疏算法和正交匹配追踪重构算法进行仿真工作。两种算法均针对一般周期信号、非周期信号、语音信号进行了仿真工作。