论文部分内容阅读
“大数据”(Big Data)时代的到来带来了飞速增长的信息量和信息处理任务。传统的奈奎斯特采样定理提出的最低采样速率在面对超宽带信号或冗余度较高的信号时,不仅在采样端处理任务复杂,而且在后续的存储和压缩时对系统资源造成了浪费。压缩感知技术近年来由于可以实现对信号在采样过程中同时压缩,受到信号处理领域的广泛关注。对于完整的数字语音处理系统而言,采样后的量化编码也是一个重要的环节。然而,目前压缩感知理论还处于研究的起步阶段,对压缩采样后的观测序列处理技术如编码的研究还很少涉及。压缩感知技术作为一种可以代替奈氏采样的信号采样技术,而编码是压缩感知从理论走向实际应用的必要前提。在这样的背景下,本文以压缩感知为基础,研究语音信号压缩感知观测序列的数字编码技术。论文的主要工作和创新点归纳如下:(1)经典的基于奈氏采样语音压缩编码技术中,基于模型的编码得到广泛应用。受到传统语音模型中正弦模型的启发,本文首先对一种利用正弦原子构造的字典和正交匹配追踪算法对语音压缩感知观测序列进行建模,对于每帧观测序列幅度、相位和频率三类参数,根据各类信号序列自身特点采用合适的编码方式进行编码,提高传输的效率。在解码端,利用解码后的参数合成观测序列。之后对其利用基追踪算法重构出合成语音信号,并后置低通滤波器提高合成语音的人耳听觉效果。仿真实验表明:该编码方案在实现对语音信号观测序列压缩编码的同时,主客观重构质量均可以得到保证。(2)利用压缩感知框架下行阶梯矩阵投影后观测序列可保留部分语音特性的特点,采用稀疏表示字典对观测序列进行数学建模的方法,设计了一种新型语音压缩感知编解码器。首先在训练阶段,先利用K奇异值分解方法对大量训练语音通过行阶梯投影后的观测序列进行训练,得到一个语音观测序列码本字典;然后在编码阶段,选取字典内的少量原子对实时语音观测序列建模,编码时仅对少量选择原子的位置和幅度进行编码并传输;解码端利用恢复后的观测序列和压缩感知重构算法恢复语音信号。通过仿真实验表明:基于稀疏表示的语音观测序列编码方案可有效的降低编码传输码率,并且保证良好的重构语音性能。