论文部分内容阅读
由于网络上共享的音频资源经常会混入各种噪声,导致这些音频资源的质量参差不齐;另外,随着数字化进程的加快,许多珍贵的旧唱片等也采用数字化的存储方式,然而在这个过程中经常会引入噪声,严重影响其音质。如何增强这类音频的质量是目前亟待解决的一项课题。 本论文主要针对音频信号中的咝咝(Hiss)噪声、谈话(Babble)噪声、办公室(Office)噪声、街道(Street)噪声、车内(Volvo)噪声和削波(Clip)失真的去除展开研究,提出了几种音频增强算法,并最终实现了一套基于AAC码流的音频增强算法。 在Hiss噪声去除方面,考虑到MDCT系数的高阶系数主要为噪声成分,本文引入了修正的绝对中值标准差(Modified Median Absolute Deviation,MMAD)来估计Hiss噪声。本文首次利用修正的离散傅里叶变换(Modified Discrete FourierTransform,MDFT)系数进行人耳听觉掩蔽阈值的计算,并将参数软阈值方法与掩蔽阈值和掩蔽参数相结合来消除音频信号MDCT系数中的Hiss噪声。同时,结合实际应用,提出了一种基于AAC码流的Hiss噪声抑制算法,有效去除了音频信号中常见的Hiss噪声。 在典型噪声(Babble、Office、Street、Volvo)抑制方面,由于音频信号中弱信号成分对其音质有很大的影响,所以本文引入修正的加权递归平均算法(Modified Weighed Recursive Averaging,MWRA)来保护含噪音频信号中的弱信号成分,防止其被估计成噪声成分。考虑到音频信号有很强的掩蔽能力,本文引入了人耳听觉模型,并结合自适应的β阶高斯统计模型,提出了一种基于MDCT的典型噪声增强算法,有效抑制了MDCT系数中的典型噪声。为了能够用于去除网络音频信号中的典型噪声,将前述的典型噪声增强算法与AAC编解码器相结合,本文提出了一种基于AAC码流的典型噪声抑制算法。 在削波(Clip)失真修复方面,本文首次在频域根据MDCT系数提取相关音频特征,并将这些特征用来训练Fisher最优投影方向和分类阈值;然后利用Fisher线性判别方法进行Clip检测以及利用子带包络码书映射的方法来修复MDCT系数中的Clip失真;最后本文将该算法应用到AAC编码器中,提出了一种基于AAC码流的Clip修复算法。 主客观测试结果表明,本文所提出的音频增强算法能获得较好的噪声消除效果,并且增强音频的感知质量有明显的提高,算法性能优于参考算法。