论文部分内容阅读
听觉系统受到特定的声音刺激后中枢神经系统产生的与外界刺激相关的生物电变化称为听觉诱发电位(Auditory Evoked Potentials, AEP),目前最为人熟知的是听性脑干反应(Auditory Brainstem Response, ABR),其中最常用的是短声(click)刺激引出的ABR(click Evoked Brainstem Response, click-ABR),健康人的click-ABR一般包含7个特征波:Ⅰ~Ⅶ波,各波的潜伏期不同,因为它们都有各自的起源。简单声(比如短声、纯音)诱发的ABR广泛应用于临床听阈估计、检查听觉通路中的病变、估计听觉通路的完整性等。尽管如此,但由于这些简单声与我们日常生活所接触到得复杂声(如言语、环境噪声等)差别甚大,它们引出的ABR能用来表征听得见,但却不能用来表述是否能听懂。人类环境中的复杂声具有丰富的谐波、频率信息变化迅速等特点。这些特性的在脑干中的编码主要分为精确的时域编码和频谱编码,引出的ABR包含瞬态反应和持续反应两个部分。这些都是与刺激的声学特性密切相关的,瞬态反应与非周期特征有关,而持续反应则与刺激的周期性特征有关。尽管短声和纯音在各自引出的ABR中较好的表征了瞬态反应和持续反应模式,用它们却无法估计出同时包含瞬态和持续特征的复杂声引出的ABR。因此,相关学者开始研究复杂声刺激引出的ABR。其中目前较为成熟的是合成言语(speech)单音节/da/诱发的ABR相关研究。时间长度为40ms的合成言语/da/诱发出的speech-ABR(da-ABR)研究已较为成熟。/da/包含瞬态和持续两个部分,前者为辅音/d/,持续时间为10ms,后者为元音/a/,持续时间为30ms。元音/a/包含3个准周期波:d、e、f波,周期约为10ms,这部分含有基频(Fo)以及五个共振峰(F1-F5)的信息,其频率分别:F0=103~121Hz,F1=220-720Hz,F2=1700~1240Hz,F3=2580-2500Hz,F4.5=3600-4500Hz。/da/引出的言语诱发脑干反应(Speech Evoked ABR, speech-ABR)可用来研究刺激的声学特征是如何在听觉系统中被编码的,并且其结构与/da/的声学结构非常相似,也可分为瞬态和持续两个部分。前者包括起始反应(onset reponse,OR),后者包括频率跟随反应(frequency following response, FFR)。其中OR(V、A波)为辅音/d/引出的反应,FFR部分(D、E、F波)被认为是刺激中的周期部分元音/a/引出的反应。FFR部分的D、E、F波为准周期波,分别为/a/中对应准周期波d、e、f引出,继承了/a/的周期特性,周期为10ms左右,与/a/的周期基本相同。有研究表明FFR部分中的三个准周期波具有显著相关性,提示可将FFR部分视为一个整体性的生理指标并可能源自相同的神经处理机制。FFR部分时域波形的周期性表征了脑干是如何编码元音/a/的基频信息,而基频信息是辨识言语的最重要信息,因此,可根据在speech-ABR的时域波形D、E、F波的完整性来判断脑干对言语/a/编码的程度。而在实际应用中,虽然所有受试者的总体平均波形FFR都非常清晰,三个准周期波容易分辨,但对单个受试者的speech-ABR进行分析时,FFR部分一般都很模糊,难以直观分辨出三个准周期波,这就说明需要采用信号处理技术在时域中突出FFR部分的准周期波,有利于临床应用FFR部分来判断脑干是否对言语/a/进行了编码或者编码完整。由于听觉系统的非线性特点,speech-ABR是非线性、非平稳信号,而希尔伯特黄变换(Hilbert-Huang Transform, HHT)是现在发展较成熟的处理非线性、分平稳信号的方法。HHT分为两个步骤:经验模态分解(Empirical Mode Decomposition, EMD)和希尔伯特(Hilbert)变换。EMD是将非平稳数据分解为有限个本征模态函数(ntrinsic Mode Function, IMF),每一层IMF基本都是平稳信号,并且IMF在任意时间点的振动模式唯一,即瞬时频率唯一。EMD是按照信号本身时间局部特征分解的,是自适应的。speech-ABR原始时域波形中的任意时间点可能包含多个瞬时频率,因为FFR部分的三个准周期波表征了元音/a/的基频信息,则它们的振动模式应该相似,经EMD后,它们应该会集中分布在同一层或相同几层IMF上。本文提出一种基于希尔伯特黄变换的瞬时能量谱方法来分析speech-ABR中的频率跟随反应部分,因为speech-ABR忠实的模拟了刺激信号的波形结构,再加上基于希尔伯特包络的瞬时能量能够突出极值,所以瞬时能量谱可能会比直接在原始时域波形中根据幅值绝对值最大来检测FFR部分跟有效。本文用实验证明此方法可以将FFR部分从speech-ABR中突显出来,有利于进一步的分析和临床应用。该方法的具体步骤如下:(1)将个体speech-ABR进行经验模态(empirical mode decomposition, EMD)分解,得到有限个本征模态函数(intrinsic mode function, IMF);(2)计算每一层IMF的瞬时能量谱;(3)观察个体speech-ABR分解后IMFs的瞬时能量谱,记录准周期波D、E、F出现的层数;(4)利用时窗为10ms,对该层瞬时能量谱17-47ms范围内寻找D、E、F波,记录下潜伏期和极性。实验记录了29例成人的speech-ABR。实验过程包括四个步骤。首先,临床专家根据V波是否明显找出有效数据,总共有25例(86%)。第二,临床专家在有效数据中根据FFR部分是否明显,将其分为两组:典型组和非典型组。其中典型组有7例(28%),非典型组有18例(72%),非典型组的个体speech-ABR中FFR部分不明显。第三,对着25例有效数据采用基于HHT的瞬时能量谱方法进行处理。最后,临床专家在这25例有效数据的瞬时能量谱中观察FFR部分,发现有23例(92%)FFR明显,有2(8%)例无法判断。结果表明,本文提出的方法突出表征了个体speech-ABR中的FFR部分,对检测FFR部分确实有效。该方法与常规方法相比有如下两个突出优点:(1)个体speech-ABR中的FFR部分在瞬时能量谱中明显比在speech-ABR时域波形中清晰可辨;(2)个体speech-ABR中FFR部分的准周期波极性不尽相同,可为正波可为负波,但在瞬时能量谱中,均为正波。可见,此方法比常规方法更有效更准确,可用于临床上直接或辅助检测D、E、F波。