BCC算法的实现及基于NDFT的参数估计改进

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:zkteacher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双耳信息编码(BinauralCueCoding,BCC)是近几年兴起的一种多声道音频编解码技术,通过将多声道的音频信号缩混为单声道的和信号,同时提取声道之间与人的空间听觉相关的小数据量的边信息,能实现传输和存储数据量的压缩。BCC可以利用现有的传统的编解码算法实现底层压缩,更进一步的降低数据量。BCC是有损压缩算法,无法实现音质还原的完全透明。对于某些双声道环绕声信号,BCC解码后的音质还存在某些缺陷。   本文以双声道的3D音频信号为例,根据BCC算法的基本流程原理,实现了基于MP3底层编码的BCC算法。在此基础之上,本文通过几个简单的音频信号的编解码效果对比,指出算法中可能存在的一些局限性。对此,本文引入了非均匀离散傅立叶变换(NonuniformDiscreteFourierTransform,NDFT),提出了一种从时域到心理声学频域的变换方法,提高了低频段参数估计的谱线数目,适当降低了高频段参数估计的谱线数目,从而尝试了对BCC算法的改进。   为了评价改进后算法的效果,本文根据ITU的相关标准,设计了相应的主观评价方法,并组织了17个人的测听实验。在5分制的评价结果中,改进的BCC算法的音质评价平均得分为4.43分,声像宽度平均得分为3.99分,比传统算法的4.25分和3.59分都要高。这表明,改进算法较传统算法无论是整体音质还是声像宽度还原都有了一定的改善。另外,结果也表明,基于MP3底层编码的BCC算法较MP3算法具有不少的优越性。   本文最后总结本文的工作,分析了工作中遗留的种种问题,对后续工作提出了展望性的意见。  
其他文献
随着模式识别和人工智能的不断发展,人的行为分析作为计算机视觉的一个重要的研究领域取得了长足的进步。其研究从简单场景下二值图像中人物的黑白剪影发展到大范围视频里复杂
大区域洪水监测网格旨在应用虚拟星座这一先进的对地观测技术和空间信息网格技术,实现数据资源、计算资源、信息资源、知识资源等各类资源的全面共享。并通过各机构的协同工作
目标方位估计是阵列信号处理的基本问题之一。许多目标方位估计方法是基于平面波假设的,但在一些情况下比如浅海环境中,这个假设往往是不准确的。因为在浅海环境中,声源可以激发
学位
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
目的:应用酵母双杂交技术筛选胞内氯离子通道蛋白1(CLIC1)的结合蛋白,以进一步了解其功能。构建带GFP标签的重组胞内氯离子通道蛋白2(CLIC2B)的表达载体,为以后的研究奠定基础。
能见度是高速公路运行安全的要素,低能见度往往会导致恶性交通事故。传统的气象能见度检测仪造价昂贵,维护复杂,难以沿高速公路线密集架设,以实现低能见度气象的全程监测。为此,提
体内超声碎石(简称超声碎石)因其安全有效而被广泛应用于结石治疗中。和其他的功率超声应用设备一样,超声换能器的设计和频率跟踪是影向设备性能的两个关键问题,也是该领域研究
学位
摘要:作为一名初中思想品德教师,我认识到我必须不断学习和探索适应新课程的教学方法,让学生真正能从思想品德中有所获,让学生热爱思想品德的学习。以下我谈谈在这八年教学中的一些体会与大家分享,希望通过与大家交流而得到更多的启发。  关键词:初中生;思想品德;教师  一、处理好教师与学生的关系  教师与学生的关系对于思想品德课的教学效果有重大的影响。在成绩的压力下,师生关系往往是紧张而尖锐的,这导致了学生
VoIP(Voice Over Internet Protocol)是下一代网络NGN(Next Generation Net-work)研究的热点,它是一种基于IP网络的数字化语音传输技术,采用的是分组交换技术。SIP协议因其简
随着无线通信技术的飞速发展,频谱资源变得越来越紧张。频谱资源是一种不可再生资源,为了使频谱资源得到更充分的利用,认知无线电技术应运而生,并得到了广泛研究和发展。频谱