双耳三维虚拟声生成与定位研究

来源 :江汉大学 | 被引量 : 0次 | 上传用户:whlibb2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为新一代信息技术融合创新的典型,虚拟现实技术取得巨大成功,不仅带给观众极大的视觉冲击,同时也让三维沉浸声场体验受到大众的期待。虚拟现实技术希望能通过耳机播放三维虚拟声,因此基于耳机播放的双耳三维虚拟声生成与定位研究受到学者的广泛关注。双耳三维虚拟声主要通过头相关传输函数(Head-Related Transfer Function,HRTF)来实现,利用已知空间位置处的HRTF与单声道音频信号进行卷积即可生成对应位置处的双耳三维虚拟声。然而经过实验测量得到的HRTF由于测量设备、时间成本等原因,其测量位置相对稀疏,生成的三维虚拟声会出现声像定位失真的问题。另一方面,HRTF是一组人体测量参数对声音的综合滤波,具有高度用户个性化的特点,使用非个性化的HRTF会使受试者出现头中定位或者声像前后混淆定位不准的问题。从空间分布相对稀疏且样本数量较少的HRTF数据库中通过插值和个性化方法生成双耳三维虚拟声是解决上述定位问题的有效途径,为此本文主要开展了以下工作:(1)基于三维虚拟声定位感知一致的双耳信号生成。针对传统方法在利用头相关传输函数(HRTF)构建三维虚拟声双耳信号中,因采集数据空间分辨率不足导致双耳三维虚拟声定位失真的问题,研究三维空间中任意位置处声源位置与已有HRTF数据合成三维虚拟声位置在双耳感知上的失真影响规律,提出一种基于双耳感知一致的头相关传输函数插值方法,在信号失真比(SDR)上提高了1.72d B,主观听音测试表明所提出的方法在生成的三维虚拟声双耳感知定位MOS评分上达到了3.89分;(2)基于HRTF的双耳三维虚拟声信号个性化生成。针对传统方法采用通用HRTF构建三维虚拟声时未考虑听者间双耳、头部、躯干等人体特征参数影响听者对三维虚拟声空间定位失真的问题,研究人体物理特征参数与合成三维虚拟声双耳信号间的映射规律,提出一种基于深度学习的头相关传输函数个性化方法,在均方根误差(RMSE)降低了1.13d B,且主观测试表明本文的方法生成的三维虚拟声前后混淆率降低了6.25%。(3)双耳三维虚拟声生成与定位系统。针对目前HRTF采集过程实验环境要求复杂,难以精确获得用户人体测量参数的问题,设计并实现了人体测量参数采集系统用于受试者人体测量参数的智能采集,并在此基础上实现了双耳三维虚拟声生成与定位系统。本文通过分析双耳三维虚拟声定位失真的相关机制和映射规律,对头相关传输函数通过插值以及个性化方法得到高空间分辨率且用户个性化的HRTF,并在此基础上设计实现了双耳三维虚拟声生成与定位系统,该系统使用个性化的HRTF和单声道音频信号渲染出声像定位更准确且沉浸感更强的双耳三维虚拟声,该系统可以广泛应用于新闻、科研、教育和娱乐等行业,有一定的应用价值。
其他文献
汉代是我国历史上伟大的朝代,其经济、文化、艺术都较发达。以画像石艺术最具特色,是绘画与雕刻结合的典范,也是现实主义和浪漫主义相结合的大成之作。以其丰富的文化内涵,夸张意趣、古拙朴素、雅致秀美的艺术风貌将中国古典艺术发展到巅峰,在中国美术发展史上占有及其重要地位。随着时代不断进步和发展,新时代提倡文化自信与科技强国,建构国家的文化身份认同,彰显了五千年灿烂文化的深厚底蕴,以弘扬优秀传统文化来推动科技
学位
近年来,具有感知信息丰富、成本低、便于携带等特点的RGB-D SLAM受到了广泛的关注。在室内弱纹理多结构化环境中,受限于点特征的高度依赖性,使得室内环境下的多结构化特征无法得到充分的利用。针对上述问题,本文提出了一种融合点面特征的RGB-D SLAM算法,该方法有效利用了结构化平面特征和点特征,通过点面特征的融合有效地估计出了相机的运动轨迹,同时构建了全局一致性的地图,从而提升了室内弱纹理多结构
学位
目的 探讨小蓟饮子加减方联合术中温热膀胱冲洗液对前列腺切除术后出血的临床疗效。方法 选取行前列腺切除术的126例老年患者。根据随机数字表法分为两组,两组在腰硬联合麻醉下行前列腺切除术,术前留置导尿管,术中及术后均使用温热生理盐水进行膀胱冲洗,术毕回病房后立即进行密封式持续膀胱冲洗,当冲洗速度≤30滴/min且冲洗液澄清时即停止。观察组术后口服小蓟饮子汤剂治疗,对照组不做其他治疗。及时记录患者术后当
期刊
色号检测装置是对透光率的一种检测装置,色号是对透光率大小的定量描述。色号检测主要用于焊接护目镜的标定和生产检测。目前国内焊接护目镜的生产厂家数量众多,是世界最大生产国。主要国内厂家的色号检测设备都是从国外相关检测机构购买。为了实现进口替代的目的和我们国家标准的配套需求,色号检测技术的研究有巨大的市场价值。本研究设计了一套精密色号检测装置,包括光源、光敏检测电路、高精度A/D转换和基于SIM32的控
学位
桥梁是极其重要的道路交通基础设施,在我国国民经济建设中占有重要的地位,但近些年来由于恐怖袭击与意外爆炸等原因引起的桥梁结构的破坏已经给人民的生命财产安全造成影响,所以对于桥梁的抗爆性能研究迫在眉睫。小箱梁结构已被广泛应用于城市高架桥,遭受意外爆炸的风险较高。本文针对意外爆炸发生在桥面的情况,提出了物理模型试验方法,设计制作了缩尺为1/2的小箱梁物理模型。制定了小箱梁模型接触爆炸试验方案与测点布置方
学位
碰摩故障是旋转机械中一种常见故障。声发射检测技术具有响应灵敏度高、频响范围宽、频率成分丰富等特点,在碰摩故障诊断中具有独特的检测优势。光纤光栅具有抗电磁干扰、体小质轻、灵敏度高、易于集成等特点。本文将光纤光栅传感技术和声发射技术相结合,开展旋转机械碰摩故障检测技术研究。主要进行了旋转机械碰摩机理和声发射频散理论的分析,设计了磁吸式光纤光栅碰摩声发射传感器。仿真研究了声发射信号在轴类零件中的应变波传
学位
伴随着都市化进程在中国的不断深入,促使都市发展节奏加快,而都市青年作为都市的主要群体,深切的感受到都市压力与都市问题。针对当下青年群体的隐形焦虑,笔者通过查阅文献资料、社会调查、参观展览等途径,以图像学、艺术社会学、艺术史学、都市文化为研究方法,得出都市社会维系了一种人类文化生存秩序,每一个生命个体都是社会生存文化的缩影,要想创作出具有特定时代性、鲜明感染力的艺术作品,就要关注都市青年的生活状态,
学位
表面增强拉曼散射(SERS)具备特有的指纹光谱,无需样品预处理即可进行快速无损检测,并且具有较高的检测灵敏度,这些优点使得SERS被用作强大的分析技术,在物理、化学、环境保护、生物、新材料、医学以及农业等方向的应用得到极大重视。近年来SERS活性基底的制备是其研究领域的一个热点,除了常用的金属基底,对于金属和其他材料复合结构作为SERS基底的研究越来越多。新型SERS基底的制备非常重要,在提高检测
学位
柔性量子点发光器件(即柔性量子点发光二极管,Flexible Quantum Dot Light Emitting diode,FQLED)除了具有发光波长可调、色纯度高、器件稳定性强等优势外,还具有可弯折、质量轻薄、制备简单等特殊优势,是一种具备广泛应用前景的新型显示技术。但柔性QLED器件仍然存在着一定的问题,外界弯折力学行为对器件造成影响的微观机制仍然不明确。因此本文为探究弯折作用对器件性能
学位
行人车辆检测作为典型的目标检测任务,在智慧交通、无人驾驶、辅助驾驶等领域都有着广泛的使用。但真实场景中往往存在人员及车辆的尺度不一致、交通环境复杂等问题,增加了检测的难度。目前的行人车辆检测领域大多使用基于anchor-based的目标检测算法,该类算法利用预先设置的anchor框,带来大量的超参数,影响检测速度。近年来,基于anchor-free的目标检测算法被提出,相比anchor-based
学位