Ambisonics声像重放的优化方法研究

被引量 : 2次 | 上传用户:cnreon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Ambisonics三维音频技术可以采用不同的扬声器阵列实现二维(Two-dimensional,2D)或三维(Two-dimensional,3D)声像的重放。然而,在不规则扬声器配置下,采用逆矩阵法所得的重建声像定位质量较差。为提高重建声像定位质量,本文基于ITU-4、ITU-5和Auro-10不规则扬声器配置,研究Ambisonics声像重放的优化方法。本文的研究成果可以总结为以下几个方面:首先,在采用一阶Ambisonic实现2D声像重放时,由于低频目标在多目标优化中占有支配性,从而导致了重建声像的高频定位质量较差。针对这一问题,本文采用基于加权比例和遗传算法的方法来自动去除低频目标的支配性,充分优化高频目标,从而提高重建声像的高频定位质量。在ITU-4扬声器配置下,所提方法的一阶重建声像高频定位质量得到了有效提高。双耳声级差(Interaural Level Difference,ILD)的客观测试表明,本文方法的重建声像在高频听觉感知度上比参考算法更接近真实声源。其次,在采用高阶Ambisonics(Higher-order Ambisonics,HOA)实现2D声像重放时,因为待优化参数不断增多,所以导致了遗传算法收敛性能的下降。针对这一问题,本文提出了基于最优对称虚拟传声器响应的HOA声像重放的优化方法。该方法使待调整的系数减少了一半,并使遗传算法收敛于听觉感知度更好的对称虚拟传声器响应。在ITU-5扬声器配置下,所提方法的四阶重建声像定位质量得到了有效提高。双耳时间差(Interaural Time Difference,ITD)和ILD的客观测试表明所提方法的重建声像听觉感知度较参考算法更接近真实声源。最后,本文研究了基于Auro-10扬声器配置的3D Ambisonics声像重放方法。针对固定3D扬声器增益参数不能同时较优地实现各方向声像重建的问题,提出一种基于空间方位格点量化技术(Spatial Localization Quantization Point,SLQP)的多增益融合声像重建方法。对Ambisonics信号中的原始声源进行方位估计并量化至SLQP格点上,用多组扬声器增益参数分别重建各量化方位上的声像。最终得到的3D重建声像定位质量优于传统固定增益参数方法。
其他文献
随着时代的发展,姓名权和商标权制度的发展产生了密不可分的联系,越来越多的姓名商标出现在人们的生活中。名人的姓名逐渐商业化,抢注名人姓名商标的行为屡见不鲜,屡禁不止。
<正>1验案举例1.1麻黄连翘赤小豆汤合泻白散化裁治疗糖尿病皮肤瘙痒案吴某,男,58岁,2017年1月10日初诊。患者自述染患2型糖尿病10年余,2月前开始出现全身皮肤瘙痒,呈阵发性,
随着世界经济全球化和一体化步伐加快,企业经营国际化已成为势不可挡的热潮。本文将以TK公司为例,对在华跨国公司在跨文化背景下人力资源管理的规划问题进行深入的研究和探索
工区目的层的岩性主要为低速煤层、高速灰岩和等速砂泥岩,地震资料中波阻抗和强振幅主要反映了低速煤层和高速灰岩,由于砂泥岩为等速,所以利用速度反演和波阻抗不能有效解决
对于互动式教学,相信每一位信息技术学科教师都耳熟能详,在平时的教学中也会有意识地加强互动。但往往“理想是丰满的,现实是骨感的”,很多时候课堂互动起不来,有时好不容易
植物真菌病害是造成各国农业损失的主要原因之一,受该病害影响,全球粮食及其他农作物减产高达20%。前期工作中,本实验室筛选到1株对引起大豆根腐病的尖孢镰刀菌(Fusarium oxy
本文从我国国有企业的具体运行方式出发分析国企行政色彩浓厚的五点表现(企业领导层的人事权集中于政府、企业党委存在干涉企业可能、国家在制度上对国企有限制、中小国企官
词汇对于语言学习的重要性显而易见,在日常的教学实践中,教师和学生都十分重视词汇学习并投入了大量的时间和精力,然而学生的语言综合运用能力却没有得到相应的提高。学生往
针对国内外激光通信光束偏转微驱动构件所存在的体积大、功耗高、迟滞大、响应速度慢、控制精度低及控制方法复杂的技术瓶颈问题,开展了基于反铁电厚膜材料优异特性的激光光
随着虚拟现实技术的兴起和互联网技术的飞速发展,全景技术在地图道路导航、场景真实感浏览和数据可视化等方面得到了广泛的应用,基于车载传感器和全景相机获取的数据,通过全