空间音频编码及多声道音频恢复技术研究

被引量 : 0次 | 上传用户:kevinstudy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对影音娱乐需求的不断提高,临场感通信不断走进人们的生活。音频信号也由最初的单声道发展到多声道音频如22.2声道甚至更多声道,这些变化所带给人们的空间感也逐渐增强。但随着声道数量的增加,传输带宽会受到限制,立体声、多声道音频的传输成为关键问题。如何利用较低的码率实现较高质量的编码传输是我们需要考虑的重要问题。ITU标准组织针对此问题在2008年提出了一种应用于视频会议等交互式通信场景的低复杂度、全频带的音频编码标准G.719(G.722.1-FB)。该编码算法基于变换编码,采用了自适应时间分辨率、自适应比特分配和晶格矢量量化、Huffman编码等先进技术,具有复杂度低、低比特透明传输等特点本文详细介绍了常见的立体声、多声道编解码技术,ITU-T标准组织针对高清语音和音频通讯的需求,提出在G.719的编解码器增加立体声及多声道模块,对G.719进行立体声、多声道扩展。本文将Opus编码器中的CELT层立体声编码思想引入到G.719编解码器中,此外鉴于空间参数编码可以将多声道信号压缩,使其所占存储空间与带宽进一步降低,以实现高效的存储和传输,所以本文将空间参数编码技术应用到G.719编码器中,实现G.719编码器的立体声及多声道音频扩展。主观听音实验结果表明,该空间参数编码方法能够获得较高的立体声、多声道音频编码增益。此外,近年来国内外对于张量的数据挖掘机理有了一定研究,将其应用于医学图像、视频图像及交通数据等领域,并取得了较为理想的实验结果。本文基于张量CP(Candecomp/Parafac)分解的加权最优化算法对数据缺失的5.1声道音频文件进行信号内容层面的预测恢复,并利用Mushra(Multiple Stimuli with Hidden Reference andAnchor)测试方法对恢复得到的5.1声道音频文件进行测试。实验结果表明,该算法能够获得较好的音频恢复质量。
其他文献
中国,1999年已经进入老龄化社会,随着时间的增长,老年人口占总人口比重也越来越大,老龄化十分严重,老人养老问题也成为一个迫切解决的问题。养老机构解决了如今子女人手时间
二十世纪初,沿袭大陆原有表演模式的台湾布袋戏,开始了具有自身特色化的历程。在这一历史过程中,台湾布袋戏的艺术构成和文化底蕴都有了不同程度的变化,着重表现在戏文内容、
本文以钟敬文先生与中国巧女故事研究的关联为研究对象,在回溯相关学术史的基础上,分析了钟先生类型学研究方法与文化学探究视角对中国巧女故事研究的深远影响,以及由此引发
<正>党的十八届三中全会在农村土地改革问题上,肯定了土地承包经营权流转的地位,赋予了其抵押担保权能,使土地承包经营权具有向金融机构融资的功能。实际上吉林省早在2012年
本文通过分析贾平凹《浮躁》中的大众,细致勾勒出智力泯灭、冷漠麻木、与精英相互依存的众生相。
目的运用舒适护理模式对老年输液患者进行护理,以提高护理服务质量。方法对80例老年静脉输液患者在输液前、输液中、输液后进行舒适护理,同时将心理护理始终贯穿于整个输液的
《太平春》是壮剧雏形的唱本广西/丁世博(壮族)我国少数民族戏曲艺术的产生与发展过程,是与本民族喜闻乐见的民间姊妹艺术有着紧密联系的,她们在肥沃的民族土壤中吸取丰富的养料茁
随着人口年龄的老化,阿尔兹海默症(AD)现已成为一种常见的老年性神经退行性疾病,严重影响患者的日常生活,并带来压力严重的社会负担。轻度认知功能障碍(MCI),尤其是遗忘型MCI(aMCI),发展