论文部分内容阅读
咳嗽是是临床常见病症之一。随着我国科技技术的不断发展,工业化进程越来越快,人们的工作、生活也发生了明显的改善。但工业给气体、水源等环境带来严重的污染,使人们的身体健康也逐渐受到了不同程度的影响,咳嗽症状也明显地呈现出上升趋势。多数不明原因的咳嗽的发病机制、病理特征尚未明确,需通过对咳嗽的特征描述和评估诊断病情,而对咳嗽的描述评估因受到主观因素影响较大,给诊断造成了一定的难度,从而使部分患者因不能得到有效及时的治疗而导致病程长达数月之久,严重影响了患者的日常生活和工作学习。因此,开发出一种自动的、针对非固定个体的、能识别大部分在特定录音中的咳嗽声,并区分录音中其他声音的咳嗽音采集和分析系统就显得尤为重要。本文对咳嗽音识别的关键技术和咳嗽音特征进行分析,用小波包方法对咳嗽音进行了识别研究,分析了将其应用在咳嗽识别中所面临的问题,并针对这些问题提出了解决措施。论文所做工作主要如下:①对国内外咳嗽音识别系统进行综述,探讨其利用的主要技术,实现方式和系统性能。对咳嗽识别所涉及的关键技术进行探讨,分析其原理并介绍了咳嗽音的基本特征。②根据咳嗽音的特点,改进了传统的端点检测算法,采用后端自适应门限更新法来更新门限,改进起始点确定条件,并采用谱熵均值排除部分语音段。通过实验证明,运用此算法进行咳嗽音的端点检测可提高检测率和起始点检测的准确性。③介绍了常用的两种特征参数LPCC和MFCC及它们的差分参数,并把LPCC和MFCC及与它们的一阶、二阶差分参数的组合特征运用到咳嗽音识别中,同时还详细介绍了运用HMM模型实现咳嗽音识别的具体实现过程,通过模糊C均值聚类对特征参数进行矢量量化提取HMM模型的输入观测序列。最后通过实验证明MFCC组合特征参数和HMM模型在咳嗽音识别中的有效性。④利用频谱分析的方法对咳嗽音及其他声音信号的特征进行了分析,根据分析结果针对信号能量分布不均匀采用了最小熵标准确定最佳结点,通过对由此得到的结点上进行特征提取不仅可以提高特征参数的性能还为提高处理速度及减少存储空间等提供前提条件。其后提取了一种基于MFCC提取原理和小波包分析方法的特征值。通过实验证明,采取论文提取的特征得到的识别率高于MFCC特征的识别率并且具有较高的鲁棒性。