论文部分内容阅读
现实中,语音信号总是不可避免地要受到其它信号的干扰,导致语音质量下降。降低噪声干扰,提高语音通信质量对人类的生产生活及技术的推动都有着积极的作用。如何尽可能地提高语音信号的质量和可懂度是语音增强算法研究的重要内容。压缩感知(Compressed Sensing, CS)是一种新型的信号采样编码理论,利用对信号压缩测量得到的少量观测值就可以精确或者高概率地重建恢复信号,在采样压缩过程有效地提取并保留信号的有用信息。本文首次将CS理论应用到语音增强处理中,提出了一种基于CS的语音增强新算法。该算法利用CS过程对信号的有效提取和恢复实现语音的增强处理,为语音增强技术提出一种新的思路。对CS理论的正交匹配跟踪(Orthogonal Matching Pursuit, OMP)重建算法进行了改进,得到双阈值正交匹配跟踪(Double Thresholds OMP, DTOMP)算法。DTOMP算法采用相似度和能量双阈值控制信号重建迭代过程,在白噪声、色噪声以及类似语音的色噪声干扰下,都能很好重建恢复增强语音。在传统分位数的研究基础上,提出了自适应分位数噪声功率估计新算法,用于估计带噪语音中的噪声功率,进而设置DTOMP算法中的能量阈值。改进后的自适应分位数法对分位数初值的设定没有要求,相比传统分位数,对噪声功率的估计更准确。在不同信噪比的白噪声和色噪声干扰环境下,分别用信噪比和对数谱测度两个指标对本文提出的CS语音增强新算法进行客观评价,并与经典的谱减法和子空间算法进行对比和分析。实验结果表明,本文的CS语音增强新算法在降噪性能上优于谱减法和子空间算法。设计开发了语音处理仿真平台,用于实现数字语音信号分析和处理算法的可视化仿真。依照组件对象模型(Component Object Model, COM)技术规范,采用C/C++开发语言,根据实际需求,设计并实现了仿真平台的主要模块,包括控制器、仿真界面和项目管理等。该平台实现了语音信号分析处理算法的可视化编辑与调试,具有使用方便、灵活性强和可扩展性好等优点。