论文部分内容阅读
近年来,压缩感知理论是国内外信号处理领域学者的研究热点,它的“边采样边压缩”使得A/D转换后数字序列、速率能够远低于传统的奈氏采样定理的特点,是最大的引人之处。本文将压缩感知理论应用于语音信号领域,研究语音信号的压缩感知技术,特别是最佳压缩投影和重构性能。本文分析了语音信号自身的特征,并以此优化观测矩阵,达到改善语音信号的压缩感知和重构性能的目的。本文首先提出了一种基于最优观测的语音压缩感知方法。该方法利用了语音信号在DCT域的近似稀疏性,结合最优观测算法找出DCT基对应的最优观测矩阵,然后采用求得的最优观测矩阵对语音信号进行投影观测。实验结果表明,基于最优观测矩阵的压缩感知的重构语音的质量较好,该方法提高了语音的压缩感知和重构性能。依据语音信号的某一特性自适应地构造观测矩阵,即语音信号的自适应压缩感知,是本文另一个主要研究内容。根据相邻的不同类型的语音帧有不同的帧间变化量,本文提出了一种新的语音帧间自适应压缩感知算法。实验结果表明该帧间自适应压缩感知的重构性能比非自适应压缩感知更好。本文第三个研究内容是进一步研究语音的自适应压缩感知,提出了一种基于清浊音判断的语音自适应压缩感知方法。该方法分别由帧间自适应和帧内自适应组成。帧间自适应首先依据语音帧的短时能量和短时过零率判断语音帧属于清音帧还是浊音帧,基于浊音信号含有的信息量比清音信号更多且对语义更重要的事实,然后由整段语音信号中清音帧的总个数和浊音帧的总个数自适应地分配较多的观测数给浊音帧。在帧间自适应确定观测个数之后,帧内自适应根据本帧语音的能量特性自适应地从全局观测矩阵中选取能量最大的行向量构成最佳观测矩阵。实验结果表明,上述基于清浊音判断的语音自适应压缩感知算法大大改善了重构语音的质量,并且帧间自适应和帧内自适应都有助于提高语音压缩感知的重构性能。