论文部分内容阅读
传统的信号与信息处理技术都是基于奈奎斯特采样定理的,定理表示信号采样速率只有在大于等于信号最高频率两倍的情况下才能无失真地恢复出原始信号,因此语音信号处理的很多数学模型都是建立在奈奎斯特采样的基础上的。对于宽频带的信号,采样速率相应地要求非常高,这无疑已经成为限制其发展的瓶颈。近年来,倍受国内外关注的压缩感知理论是一种新的采样模式,该理论表明,对于可压缩信号在采样的同时就可以进行压缩,其采样速率远远低于奈奎斯特采样速率,该理论根据信号稀疏的先验知识,利用重构算法对较少的随机观测数据进行恢复。目前压缩感知的研究集中在三个方面:随机观测,稀疏基的构建以及重构算法。
语音信号处理作为常用的信号处理技术之一,压缩感知的研究推动了其发展。研究语音信号的稀疏域,重构算法,在压缩感知的框架上重新建立数学模型,突破传统的采样、处理模式,将具有重大的实际应用价值。本课题以理论研究为前提,分析了语音信号在不同稀疏域表现出的特性,并引进线性预测残差域和自适应训练字典作为语音信号的稀疏基,详细讨论了压缩感知原始框架的加密特性,将压缩感知理论与语音信号处理技术相结合,分析基于压缩感知采样的压缩性能,对重构的语音信号用客观的帧平均信噪比和通过ITU组织发布的语音传输质量测量标准P.862,即语音质量的感知评价PESQ(Perceptual Evaluation of Speech Quality,PESQ)方法验证重构的语音质量;然后分析了压缩感知的加密特性,构建基于压缩感知的联合语音压缩和加密的语音信号处理框架,提出将混沌观测与压缩感知相结合,增加了系统的安全性并使得加密系统受控,产生可靠的、低速率的码流;最后提出将压缩感知应用于语音信号处理技术中的热点问题——欠定盲源分离,对使用不同稀疏基以及不同混合系数的情况都做了相关实验,并展现和分析了实验结果。
本文最后对所做的工作和成果做了总结,并对今后的工作进行了展望。