论文部分内容阅读
音频定位技术作为一门新兴的边缘交叉学科,涉及听觉心理学、听觉生理学、人工智能和高性能计算机系统等多个研究领域,且具有广泛的应用前景,它可以帮助传递和识别可视信息,增强三维仿真环境的逼真度、想像力和沉浸感,在军事和民用方面有广泛的应用。音频定位技术是通过对一包含单个或者多个模拟声源的声场进行建模,以达到对各声源音频定位的目的。这样,人们可以获得该声场中任意位置的双耳听觉感受。假头(人工头)型立体声系统已有六、七十年的历史,由于它具有声像逼真、自然,且只需要两个独立的传输信号等突出优点,几十年来研究工作者对其兴趣经久不衰,但由于它具有一定的局限性,以及一些技术上的困难,故未能在广播、家用立体声等方面得到广泛的应用。但近年来,由于计算机技术,数字信号处理技术等方面的发展,在假头型立体声系统的基础上,发展了听觉传输技术。它在电声、室内声、噪声、心理声学、计算机多媒体和人工虚拟环境等许多方面有广泛的应用前景,其内容已超过了假头型立体声这样一种特殊的声传输和重发系统的范畴。本文的研究内容就是听觉传输型的音频定位系统。对人类听觉生理学和心理学的了解是研究仿真音频技术的基础。因此,本文首先介绍了人类的听觉系统结构和听觉特性,接着分析了优先效应、耳廓效应等因素对音频定位的影响,阐明了人类进行音频定位所必需的耳间时间差,耳间强度差以及头部关联传递函数的概念。在此基础上提出了以头部关联传递函数为关键因素听觉传输型的音频定位系统的构成。这种系统存在一些固有的缺陷,尤其在耳机重发系统中,头中定位效应和“混淆锥”现象会影响系统的定位效果。相关研究者在对头中定位效应的消除进行了较多的研究,并且都认为加入混响在使声音“外部化”的过程中起着举足轻重的作用。本文主要针对“混淆锥”现象引起的前后声像位置倒置的问题进行研究,并提出对原始HRTF数据进行频域加权以及多声道耳机重发的两种解决方案,以提高系统定位的准确度。本文还给出了定位系统的计算机仿真实现及多声道耳机驱动的硬件设计方