数字助听器语音处理核心算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:ylw962203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在听损患者的听力矫正治疗中,佩戴助听器是最简单有效的方法。传统的模拟助听器通过硬件电路放大声音,虽然提高了语音信号的响度,但并不能弥补患者缺失的关键频率分量,在这种情况下,患者虽然能够听到声音却仍然不能理解语言。先进的数字助听器通过麦克风阵列采集语音信号,利用DSP芯片实现实时语音处理算法,对患者缺失的听力进行个性化、智能化的补偿与矫正,以提高患者对语言的可懂度。   本文回顾了数字助听器语音处理算法的研究历史与背景,介绍了数字助听器软硬件方案,指出了数字助听器语音处理算法中的热点和难点,并在深入探索听损患者听力缺失特点的基础之上,针对听力矫正的需求研究了数字助听器语音处理核心算法,取得了一些研究成果,包括:   1、提出了符合人耳听觉特征的数字助听器非等宽子带滤波器组多通道响度补偿算法。由于传统的多通道响度补偿算法基于等宽滤波器组设计,并不符合人耳听觉特征,本文提出一种基于非等宽子带滤波器组的多通道响度补偿算法。该算法根据耳蜗滤波器特点,在Bark域分割子带,对于人耳关注的语音段信号采用较窄的子带分割,而在对语言理解贡献不大的高频段采用较宽的子带分割。在各子带内,该算法根据患者的听力测试结果和信号声压级确定响度补偿增益。仿真实验证明基于非等宽子带滤波器组的多通道响度补偿算法在不增加计算量的基础上能够更精细地调节各子带的补偿能量,提高患者对语言的理解能力。   2、根据相邻频带之间无混叠并且滤波器组在整个频带范围内频率响应平坦的完美重构条件,推导了非等宽滤波器组分析滤波器和综合滤波器设计方法,并通过八通道子带滤波器组仿真实验验证了完美重构滤波器组的性能。   3、提出了加权次梯度投影自适应系统估计算法。自适应系统估计经典算法有NLMS算法、RLS算法和仿射投影AP算法等。在这些算法中,NLMS算法虽然计算量小,但是收敛速度非常慢;RLS算法收敛速度快,但是计算量巨大;AP算法虽然综合了两者的优点,但是其使用的投影算法很难定义。最近提出的次梯度投影算法用次梯度投影取代了精确的投影,只要代价函数是凸函数,都可以在计算量不大的情况下快速地收敛。本文在前人研究的基础之上,提出了一种新的加权次梯度投影算法,利用待估计路径的先验知识,修改算法按指数规律下降。仿真实验证明,该算法在已有部分信道先验知识的前提下取得了优异的收敛速度和收敛精度。   4、提山了基于加权次梯度投影的数字助听器回声消除方案。数字助听器的回声损害系统硬件和患者残余听力,最有效的解决方法是估计出外界回声路径和回声信号,并将其从系统输入中减去。本文研究了带预滤波单元的数字助听器回声估计方法,首先通过预滤波单元消除输入信号和输出信号的相关性,然后通过加权次梯度投影算法自适应地估计外界回声路径,最后将回声估计信号从系统输入中减去,以达到消除回声的目的。通过对白噪声和真实语音片段作为输入的仿真实验证明,算法对于不同长度的回声路径都取得了优良的估计性能,有效消除了系统回声。   5、在时延估计和声源定位算法的研究基础之上,结合自适应波束形成算法,本文提出一种适用于数字助听器的方向性语音增强方案。利用麦克风阵中不同阵元空间位置的不同,结合声源定位和波束形成算法,方向性语音增强技术可以在非平稳噪声和干扰声环境中提高信噪比和信干比,进而提高言语可懂度。时延估计算法估计麦克风阵各阵元之间的时延差,该时延差异结合阵列的儿何知识就可以计算出声源的空间位置,是声源定位问题的核心。本文研究了一种基于特征值分解和并行次梯度投影的自适应PSP-AED时延估计算法,该算法可以在房间共振和噪声的环境下对声源至各麦克风的传播路径进行估计,进而估计出麦克风阵元之间的时延差。仿真实验证明,相比较基于互相关的GCC时延估计算法和NLMS自适应估计算法,PSP-AED算法的收敛速度和精度都得到提高,对噪声的鲁棒性能好。在时延估计算法获得目标声源的空间位置的情况下,方向性语音增强方案结合自适应MVDR、GSC、LCMV和零陷LCMV波束形成器将波束方向指向目标声源,抑制干扰声和噪声。仿真实验证明在无共振和有共振环境下,该方案都取得了信干比的提升。   综上所述,本文针对听损患者的听力缺失特点,研究了以提高言语可懂度为目的的数字助听器语音处理算法。由于应用的特殊性,对该领域的研究目前国内外都还处于起步阶段,存在一些需要进一步深入研究的问题,例如体积尺寸微型化对麦克风阵信号采集和语音处理算法的影响、汉语或其他语言特征对听损患者理解语言的影响、声物象识别及声场景重建研究等。对这些问题的进一步研究,将提高数字助听器语音处理算法性能,促进数字助听器产业的发展,提高听损患者的听力矫正水平,改变我国在康复治疗领域的落后现状。
其他文献
随着网络通信技术的发展,互联网技术的广泛应用使视频监控行业发生了巨大的变化,促使视频监控系统从传统的模拟监控系统向数字监控系统和网络视频监控系统发展。网络视频监控系
当前互联网已经成为世界上应用最广泛的基础设施之一,伴随着云计算、物联网、移动互联网等新兴业务的不断涌现,互联网的规模也在快速增长,而传统基于TCP/IP的网络体系由于其
总部位于德国亚琛的MAGMA GmbH将在杜塞尔多夫召开的第13届国际铸造博览会GIFA (2015年6月16-20日)中展出新一代自动虚拟试验和优化软件-MAGMA5 5.3版.MAGMA将在其位于第12展
期刊
低压电力线载波通信技术(Low-voltage Line Carrier Communication,简称L-PLC)将模拟或数字信号进行载波调制后,在低压电力线(380/220V用户线)进行传输。低压电力线通信可以
国家“十二五”电网发展规划将建设安全有效的特高压电网作为其中一个非常重要的目标,而传统的依靠人工巡检的方式已经无法满足国家电网发展的快速步伐。建立特高压输电塔在线监测系统,实时监测其安全状态,可以保障国家电网安全,而特高压输电塔本身处在强电磁干扰环境中,这对无线传感网的数据可靠性传输提出了较高要求。同时该监测系统常用的无线传感器节点在强电磁干扰环境下易受干扰而导致节点失效现象出现,因此保障特高压输
摘要:小波一-Contourlet变换是一种新的多分辨率的、局域的、多方向的图像表示方法。它将Contourlet变换第一级的LP分解替换为小波变换,消除了LP分解的冗余;第二级用方向滤波器
在众多水下应用领域,成像声纳作为人类水中作业的视觉延伸,起到了至关重要的作用。本文以成像声纳研制为背景,将微电子领域中的SOPC(片上可编程系统)技术与成像声纳数字系统
数字图像因其信息量大且生动形象的特点成为当今社会人们获取和发布信息的重要手段。而存储空间和传输带宽的限制使得图像压缩成为数字图像的传输、处理、存储中的关键技术。
希尔伯特黄变换(Hilbert-Huang Transform,简称HHT)是1998年由Huang等人首次提出的一种新的非线性、非平稳信号的分析方法。其关键部分是经验模态分解方法(Empirical Mode De
为了和WiMAX,Wi-Fi等新兴的无线宽带技术竞争,国际标准化组织3GPP在2004年底启动了其长期演进LTE技术的标准化工作,即UMTS的长期演进(Long TermEvolution,LTE)技术的研究,以实现3G