论文部分内容阅读
咳嗽作为呼吸系统疾病最常见的症状,其频率、强度、种类、持续时间等参数为临床提供了重要信息。现阶段在对咳嗽评估时通常只是根据病人的主诉,缺少客观测量及定量评估的标准和分析系统。随着语音识别与人工智能的广泛应用,人们迫切希望在对咳嗽音分析与评估方面能实现真正的人机交互,让机器能够像人类那样听懂咳嗽音信号,并对检测识别出来的咳嗽音完成进一步的研究与分析工作。本文参考国内外语音识别技术和咳嗽音研究现状,通过对隐马尔科夫模型(HMM)和人工神经网络(ANN)的分析,将HMM-ANN混合模型应用于咳嗽音识别,并在MATLAB平台下进行仿真实验。本文主要内容有:1本文在分析咳嗽音产生的机理及在声学上的各类特性的基础上对咳嗽音进行预处理。结合咳嗽音的特点,对整个预处理过程中的采样,滤波,预加重,分帧加窗,端点检测等步骤进行研究。2本文分析了线性预测系数、线性预测倒谱系数(LPCC)和Mel频率倒谱系(MFCC)。通过实验对比发现,基于人耳特性的MFCC在咳嗽音识别上更优于基于声道模型的LPCC。为了更好的反映咳嗽音的动态特性,抑制噪音对咳嗽音的影响,本文对MFCC进行二次特征提取,并将RASTA与MFCC相结合,改进对数函数转换,即把带噪声抑制的标准MFCC+一阶差分作为咳嗽音的特征参数。仿真实验表明,相对于其它三种参数,带抑噪技术的MFCC+一阶差分参数对于咳嗽音信号的识别效果有所改善。3本文利用HMM较好的时序建模能力以及ANN强大的分类能力,即将HMM中的Viterbi解码后的所有状态累积概率作为神经网络的输入,经过神经网络非线性映射输出最后结果,建立咳嗽音HMM-ANN混合模型,研究了咳嗽音在混合模型基础上的学习和识别算法。基于上述研究,在MATLAB平台下对整个咳嗽音识别流程进行仿真实验,结果表明基于混合模型的咳嗽音识别性能得到一定程度的提升。