论文部分内容阅读
随着人们对影音娱乐需求的不断提高,临场感通信不断走进人们的生活。音频信号也由最初的单声道发展到多声道音频如22.2声道甚至更多声道,这些变化所带给人们的空间感也逐渐增强。但随着声道数量的增加,传输带宽会受到限制,立体声、多声道音频的传输成为关键问题。如何利用较低的码率实现较高质量的编码传输是我们需要考虑的重要问题。ITU标准组织针对此问题在2008年提出了一种应用于视频会议等交互式通信场景的低复杂度、全频带的音频编码标准G.719(G.722.1-FB)。该编码算法基于变换编码,采用了自适应时间分辨率、自适应比特分配和晶格矢量量化、Huffman编码等先进技术,具有复杂度低、低比特透明传输等特点本文详细介绍了常见的立体声、多声道编解码技术,ITU-T标准组织针对高清语音和音频通讯的需求,提出在G.719的编解码器增加立体声及多声道模块,对G.719进行立体声、多声道扩展。本文将Opus编码器中的CELT层立体声编码思想引入到G.719编解码器中,此外鉴于空间参数编码可以将多声道信号压缩,使其所占存储空间与带宽进一步降低,以实现高效的存储和传输,所以本文将空间参数编码技术应用到G.719编码器中,实现G.719编码器的立体声及多声道音频扩展。主观听音实验结果表明,该空间参数编码方法能够获得较高的立体声、多声道音频编码增益。此外,近年来国内外对于张量的数据挖掘机理有了一定研究,将其应用于医学图像、视频图像及交通数据等领域,并取得了较为理想的实验结果。本文基于张量CP(Candecomp/Parafac)分解的加权最优化算法对数据缺失的5.1声道音频文件进行信号内容层面的预测恢复,并利用Mushra(Multiple Stimuli with Hidden Reference andAnchor)测试方法对恢复得到的5.1声道音频文件进行测试。实验结果表明,该算法能够获得较好的音频恢复质量。