混响环境下基于语音声源定位的时延估计算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:hanjiezm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能技术的快速发展,语音声源定位在人机交互,语音增强及语音识别等领域越来越受到重视。其中,利用到达时间差的声源定位算法原理简单并且计算量小,在声源实时定位中被广泛的应用。时延估计算法作为基于到达时间差的声源定位算法中的关键技术,其对时间差估计的精度直接影响最终声源定位的精度。尤其在室内环境下,环境噪声及混响的存在都会不利于得到准确的声源定位。因此,在具有混响及噪声的环境下,对时延估计算法进行深入研究,提高时延估计精度具有重要的理论与实践意义。本文的具体研究内容如下:首先,本论文简单介绍了语音声源定位算法的基本理论基础,并阐述了基于到达时间差的声源定位算法原理。其次,本论文研究了室内声源信号的模型,基于反向滤波器和谱减法的去混响方法以及介绍了几种常用的时延估计算法的相关理论。由于室内混响对语音信号不同频率成分的影响不同,对不同的频率分量做相同的信号处理不能有效地提高时延估计算法精度,因此本文着重提出了一种基于分频和Wigner-Ville分布的时延估计方法。这种方法首先利用Gammatone滤波器对传感器接收到的两段信号进行分频处理,进而对每一个子带信号运用反向滤波器和谱减法以达到去混响的目的,最后计算不同子带信号基于Wigner-Ville分布的相关函数,求和后得到原来两段信号的相关值并搜索最大值对应的离散时间,即可获得时延的估计值。仿真实验证明了该算法可以有效地减弱室内混响的影响,提高了时延估计的精度。最后,本文通过构建一个简单的二维声源定位系统,对所改进的时延估计算法进行了实际测试与分析。实验结果显示了与仿真实验相同的性能趋势,即本文所提出的改进后时延估计算法优于本文中介绍的其它时延估计算法。
其他文献
中国作曲家、钢琴家、演奏家储望华先生在2003对江苏民歌曲调进行改编,进而创作出钢琴独奏曲《茉莉花》,并且同年6月,在悉尼音乐学院的音乐厅进行了全世界的首次演出.本文将
政府与社会资本合作模式(PPP模式)正逐渐深入水利基础设施建设运营领域。文章以安徽省定远县江巷水库工程为例,在OM、MC、BOT、BOO、TOT、ROT等融资运营模式方案初步分析基础上
为探究一种平行圆盘磁流变剪切屈服应力测试仪的磁场特性,结合磁路欧姆定律和安培环路定理介绍该测试仪的磁路组成,并在ANSYS软件中对磁路进行了磁场仿真;然后对该测试仪的磁场
随着CAN总线在汽车工业的发展普及,整车排放、安全及娱乐等性能对CAN总线通讯质量的要求越来越高。因此,CAN总线工作状态的监控与诊断也日渐重要。检测CAN总线报文接收就是一种
家庭功能理论从系统的角度来研究家庭,强调家庭成员间的双向作用。其主要代表理论有两类:结果取向理论和过程取向理论。结合这两类理论对青少年心理健康进行考察,得出三个结论
国内关于外语教学中的“后方法”研究和应用已经有十多年的时间,成果丰硕,研究范围包含了外语教学的诸多方面,但同时存在一些需要改进的问题,如研究的深度有待提高、理论研究
近年来随着信号处理技术不断更迭,各种智能设备不断涌现,极具交互性的语音应用其中,丰富和便利了人们的生活。声源定位是其重要组成部分,因此,基于麦克风阵列的声源定位算法成为了一大研究热门。常用的定位算法在混响和噪声存在的环境下性能表现并不理想,定位的准确率和实时性的进一步提高仍需不断研究。本文先对语音信号处理的理论基础进行了总结,采用IMAGE模型模拟室内混响环境,并进行仿真实验;然后主要研究了具有较
公司业务的发展带来了越来越多的项目,怎样管理好庞大数量的项目成了许多公司的课题。项目管理已经不再是一个孤立的部门的工作,项目管理已经成了公司内部跨部门的一个管理活
中央应对新型冠状病毒感染肺炎疫情工作领导小组会议指出,引导具备条件的企事业单位错峰上下班和居家网上办公等;我市应对新型冠状病毒感染肺炎疫情工作领导小组(指挥部)也发布命
报纸
房颤(Atrial Fibrillation,AF)是一种常见的以快速性心律失常为主要特征的心脏疾病。阵发性房颤(Paroxysmal Atrial Fibrillation,PAF)是临床上复发率最高、发作最突然的一种房颤,发作时对血液流动系统有着极其不利的影响,易在心房内形成血栓,甚至诱发其他致死性心血管疾病。准确诊断出阵发性房颤发作是控制和治疗房颤的首要任务。传统的诊断方法主要由临床经验丰富