论文部分内容阅读
在进行数字音频信号的传输和存储时,为了有效利用通信带宽和存储介质的容量往往会丢弃音频信号的高频成分,从而造成音频信号质量的降低。而在音频信号的重建过程中人们又希望能利用已获得的低频信息按照某种算法重建出高频信息,从而得到尽可能高质的音频信号。因此研究音频信号的高频重建技术具有重要的理论意义和实用价值。
本论文提出了一种基于最小熵谱估计的高频重建算法(论文中简称为(MEHFR),该算法利用最小熵准则对信号谱进行外推,从而重建出音频信号的高频分量,论文同时对提出的MEHFR算法作了改进和性能分析,并给出了MEHFR成功应用于目前主流音频编解码器——MP3的一个实例。
最小熵谱估计是现代谱估计中的一个分支,具有现代谱估计的优点,即应用于较短数据序列时分辨率较高。最小熵解卷积技术(MED)是最小熵谱估计中的一种谱扩展算法,此算法最初应用于地球物理方面,经过一些改进后,出现了频域受限的最小熵解卷积技术(FMED),算法性能得到了明显的改善,尤其是抗噪性能得到了提高。本文在将最小熵解卷积技术应用于音频信号的高频重建的时候,得到了基于最小熵谱估计的高频重建算法,即本文提出的MEHFR。MEHFR利用了最小熵准,熵越小则分辨率越高,则重建的信号频谱越准确。本文在大量的音频信号的测试后,发现了MEHFR应用于音频信号时存在一些缺陷,因此做了很多的改进,比如进行迭代循环的限制、门限的限制和谱幅的限制等等,在改进后的测试中,重建后的音频都得到了不错的音质,因此表明了MEHFR可以有效地进行音频信号的高频重建。
MEHFR作为高频重建的方法可以应用于多数主流编解码算法中,本文将MEHFR作为插件配合MP3编解码器共同工作,使得MP3处理后的音质得到了明显的提高,而本身的压缩率相差不大,通过大量测试表明了实际应用的良好效果。