论文部分内容阅读
表面刺激、组织变化等多种因素引起的声带病变,使得声带的活动性、功能性和形状等受到影响,导致声带不规则振动,整体声音质量变差。目前声带病理主要是通过侵入式喉镜检查,这种方式给患者造成不便,同时依赖临床医生主观经验评估,不同医生判断的结果可能不同。故人们希望借助计算机工具以非侵入方式分析语音信号,帮助实际诊断声带病变,为声音质量的客观评价提供统一量化的标准。基于这些原因,使用信号处理技术和机器学习算法自动计算语音特征并且准确识别正常和病理声音变得尤为重要。想要准确评估正常和病理语音,就必须提取出可以良好反映病理特性的特征参数。本文从量化语音信号的线性特征参数和非线性特征参数两方面入手分析,在传统声学特征参数的基础上,对语音信号做一系列变换处理得到非传统特征参数,将各个特征参数依次输入支持向量机建模识别,通过分类准确率判断各参数对声带病理语音的识别能力。本文结合理论分析和MATLAB仿真实验得出以下结果:1.与传统线性声学参数相比,本文的非传统线性特征参数提取不需要准确判断基音周期,方便实现,易于应用。从支持向量机识别结果来看,非传统线性特征参数比传统线性参数识别正常与病理语音的效果更好,这些非传统特征在一定程度上改善了传统特征分析病理嗓音的能力。2.利用四层小波包分解,提取语音信号不同频率范围内的非线性特征参数,得到非传统的非线性分层特征,比较特征参数分层前后的识别率发现,特征参数分层后整体识别率提高,降维优化后的特征参数包含了更多有用的信息,更有利于鉴别病理语音。3.不同参数对正常与病理语音的识别能力不同,比较参数在不同分类器下的平均识别率发现,识别率最高的是非线性特征参数分层优化模糊熵98.20%,其次是线性参数频谱平坦度98.19%,考虑到分层优化模糊熵维数比频谱平坦度的维数高,时间成本大,所以在区分正常与病理语音时选用频谱平坦度更好。4.比较不同参数对麻痹和息肉语音的识别率发现,非线性分层优化特征16维Hurst指数的识别效果最好,为96.97%,可以准确有效的区分出麻痹和息肉语音,该结果为无创检测不同类型病理语音提供可能。5.非线性特征参数在区分不同类型的声带病理语音时优势更大,这与声带病理语音的发音机制有关,喉部病变导致声带异常振动造成语音信号的湍流增加,非线性行为更明显,所以更适合用非线性分析方法研究不同类型嗓音疾病的发音特性。