论文部分内容阅读
人工耳蜗是唯一能够使完全耳聋者通过电信号刺激残留的听觉神经以恢复部分听力的医学手段。从20年前的一种主要用于让患者加强唇读和感知声音的存在的单电极装置到今天,人工耳蜗已经发展成一种能支持其全球6万用户中的大多数人顺利进行电话交谈的复杂多电极装置。近年来,人工耳蜗的适用者范围也已经被大大扩展,包括小到3个月的婴幼儿童,和有明显的功能性残余听力的成人,特别是低频率域内残余。虽然它们在不同个体上的性能差异依然很大,但平均来说,大部分使用者都可以通过人工耳蜗在安静环境下进行顺畅的电话交谈。使用人数和科技文献的数量的指数性增长,证实了人工耳蜗已经发展成为一个成熟的领域。论文首先概述了课题的研究背景以及人工耳蜗的发展历史及现状。通过介绍言语信号的合成方法、正常人的耳蜗的工作机理以及耳聋的病理学基础,阐明了人工耳蜗的工作原理,并给出了人工耳蜗的各个组成部分及其作用。目前大部分人工耳蜗使用者已经可以在安静的环境下顺利的交谈,也就是说现有人工耳蜗对于言语信号的识别率已经做的相对成熟。然而对于进一步音质的问题,对研究人员来说仍然是一个难题。例如,使用现有的人工耳蜗,当患者听音乐时只能听到有节奏的鼓点,而完全领略不到音乐的优美。其原因主要是在之前的人工耳蜗研究中,研究人员注重的是人工耳蜗对于言语的识别率忽视了言语的音质问题。而影响语音音质的关键则取决于语音的相位信息,但先前的言语处理方案完全将相位信息忽略掉了。在本文中我们通过一种新型的线性零相位滤波器—全相位滤波器,试图将语音的相位信息更好的保留下来。在人工耳蜗的发展过程中,信号处理技术扮演了十分重要的角色,一般来说按照言语处理方法的不同,言语处理方案一般分为两类:特征提取方案和波形方案。特征提取方案的策略是首先提取言语信号中的重要特征,然后再将这些特征传送到不同电极以刺激听神经,其代表方案有F0/F2、F0/F1/F2;而波形方案是将言语信号的波形以不同的方式传送到电极,其代表方案有ACE、CIS、SPEAK。在大部分已经投入使用的人工耳蜗中,CIS是一种必不可少的言语处理方案,也是被大部分患者所认同的一种方案。因此论文中以CIS言语处理方案为例来研究CIS改进方案的特性。在人工耳蜗波形处理方案中,都要用到滤波器组,其作用是将原始语音划分成若干频段,再做后续处理。在已往的CIS方案仿真中,大多数采用巴特沃夫滤波器,它是一种非线性滤波器,当语音信号通过非线性滤波器组时,语音信号被分为几个频段,但与此同时,语音信号的相位信息被改变了。而全相位滤波器是一种改进的频率采样法,属于线性滤波器,改进的方案采用线性滤波的方法来更好的保留原始语音信号的相位特性,使得最后的合成语音更为清晰,有更好的音质。文中对CIS方案的改进关键在于,语音信号通过滤波器组时采用了与已往不同的全相位滤波器组。由于全相位滤波器组的零相位特性,陡降性等优点,通过滤波器组后的语音保留了原始语音信号的相位信息,提高了语音的音质。论文详细介绍了全相位滤波器的原理,并与频率采样法相比较,通过仿真结果说明了,全相位滤波器无论是在过渡带宽度、阻带衰减,还是在纹波的均匀度方面,全相位DFT法都要优于频率采样法。并且与八通道的巴特沃夫滤波器组相比较,展示了全相位滤波器组与传统的滤波器组不一样的特性。论文通过matlab平台,对CIS方案进行仿真并得到最后的合成语音结果,通过波形图,语谱图以及实际的测听实验得到的数据表明,利用全相位滤波器改进的言语处理方案可以使最后的合成语音更加清晰,得到更好的音质。论文的最后对论文中的工作进行总结,并指出实验存在的不足之处和下一步研究工作的思路。综上所述,本篇论文所进行的研究具有三个特点:第一、第一次将全相位滤波器用于人工耳蜗CIS方案;第二、对CIS方案在matlab平台上进行仿真,并得到最后的合成语音结果;第三、利用合成语音做实际的测听,从测听结果的正确率和清晰度上,进一步说明了改进方案的优势。