数字助听器中声源定位算法的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:qq616009003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字助听器能够有效改善听损患者的听力水平,声源定位是数字助听器中的核心算法之一。本文重点研究数字助听器中的声源定位算法,并提出了改进算法。论文的主要工作包括:(1)研究了数字助听器的基本工作原理,详细阐述了语音增强、响度补偿以及回声消除等数字助听器中的关键技术。对当前常用的声源定位算法进行分析和比较,最终选择运算量低、实时性好的基于时延估计的声源定位算法作为本文重点研究的定位方法。详细介绍了语音信号数字模型、房间脉冲响应模型,并分别建立麦克风接收信号的理想模型和实际模型。(2)重点研究了当前广泛应用的广义互相关(Generalized Cross Correlation,GCC)时延估计算法,讨论了其各种加权函数的性能特点,并进行仿真实验分析。针对GCC法的缺点,结合相关峰精确插值算法(Fine Interpolation of Correlation Peak,FICP),提出了基于二次相关改进的广义互相关时延估计算法。仿真实验表明,与传统GCC法相比,改进算法具有更高的抗噪声性能和时延估计精度。(3)深入研究了互功率谱相位(Cross-power Spectral Phase,CSP)时延估计算法。针对CSP法在强噪声和混响条件下性能下降严重的缺点,提出了改进的CSP法。改进算法引入语音端点检测(Voice Activity Detection,VAD)来去除非语音帧,减少运算量的同时降低了噪声和混响的干扰,并引入一个非线性白化参数来对加权函数进行改进,然后通过多帧累加互功率谱相位来得到估计时延,进一步锐化相关函数的峰值,提高时延估计的精度。(4)对定位方法进行了系统的研究并进行设计实现。简单介绍了几何定位法和目标函数空间搜索定位法的原理和特点,然后设计了一个四元麦克风阵列的定位模型。该模型时延估计模块采用基于二次相关改进的广义互相关时延估计算法,而定位模块采用的是空间几何关系定位法。仿真实验表明,该系统模型实现简单,运算量低,具有一定的可行性。
其他文献
无线传感器网络(WSN)中节点的能量有限性、如何降低网络能量消耗和延长网络的生命周期是自WSN出现以来的重点研究问题。WSN的路由协议常常会因为节点能量耗尽失效导致整个网
当前,随着高速无线通信网络的快速发展以及新型网络结构的出现,无线网络中能量受限的移动终端等设备对能量的需求越来越成为制约网络服务质量的瓶颈。基于无线信息和能量协同
粒子群优化算法(Particle Swarm Optimization, PSO)源于对鸟类觅食行为的研究,由美国心理学家Kennedy博士和电气工程师Eberhart博士于1995年共同提出,是一种基于群智能理论
本文通过问卷调查,对东莞市村(社区)图书馆发展状况、社区综合服务中心整合村(社区)图书室的效果进行调查的基础上,提出了完善东莞地区村(社区)图书室服务的主要对策建议,认
随着计算机的产生和互联网技术的发展,说话人识别作为生物认证的一种,凭借其独一无二的优势在人机交互领域一直备受关注。说话人识别技术已经从实验室转向了实际应用中,同时
近年来,移动通信技术和互联网技术发展迅猛,逐渐成为信息产业的两大支柱,使人们的工作和生活发生了巨大的变化。移动VPN技术的出现,可以为企业节省专网费用的同时,也能为企业
随着信息技术的飞速发展,人们对网络服务的要求越来越高。接入网成为信息公路的瓶颈所在,制约着整个网络的发展。虽然各种接入技术层出不穷,但是光接入网被认为是最有前途的
数字出版是当前世界出版业发展的潮流,虽然说在以后相当长的时间里印刷出版会和数字出版共生存,但是印刷出版业的数字化转型已经不可逆转.本文分析了数字出版的范围及发展趋
随着无线通信技术的飞速发展,频谱资源变得越来越紧张。目前的频谱管理主要存在三个方面的矛盾情况:频谱使用是动态的,但频谱分配是固定的;频谱是稀有资源,但频谱利用率不高,且
在户外的科学活动中,常常需要便携的设备,实时记录海量的实验数据,以便于后续分析。而目前市场上的数据采集系统,通常不能同时具有高速、海量、便携的特点。在以上背景下,设