基于HMM-ANN混合模型的咳嗽音识别研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:obo9413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
咳嗽作为呼吸系统疾病最常见的症状,其频率、强度、种类、持续时间等参数为临床提供了重要信息。现阶段在对咳嗽评估时通常只是根据病人的主诉,缺少客观测量及定量评估的标准和分析系统。随着语音识别与人工智能的广泛应用,人们迫切希望在对咳嗽音分析与评估方面能实现真正的人机交互,让机器能够像人类那样听懂咳嗽音信号,并对检测识别出来的咳嗽音完成进一步的研究与分析工作。本文参考国内外语音识别技术和咳嗽音研究现状,通过对隐马尔科夫模型(HMM)和人工神经网络(ANN)的分析,将HMM-ANN混合模型应用于咳嗽音识别,并在MATLAB平台下进行仿真实验。本文主要内容有:1本文在分析咳嗽音产生的机理及在声学上的各类特性的基础上对咳嗽音进行预处理。结合咳嗽音的特点,对整个预处理过程中的采样,滤波,预加重,分帧加窗,端点检测等步骤进行研究。2本文分析了线性预测系数、线性预测倒谱系数(LPCC)和Mel频率倒谱系(MFCC)。通过实验对比发现,基于人耳特性的MFCC在咳嗽音识别上更优于基于声道模型的LPCC。为了更好的反映咳嗽音的动态特性,抑制噪音对咳嗽音的影响,本文对MFCC进行二次特征提取,并将RASTA与MFCC相结合,改进对数函数转换,即把带噪声抑制的标准MFCC+一阶差分作为咳嗽音的特征参数。仿真实验表明,相对于其它三种参数,带抑噪技术的MFCC+一阶差分参数对于咳嗽音信号的识别效果有所改善。3本文利用HMM较好的时序建模能力以及ANN强大的分类能力,即将HMM中的Viterbi解码后的所有状态累积概率作为神经网络的输入,经过神经网络非线性映射输出最后结果,建立咳嗽音HMM-ANN混合模型,研究了咳嗽音在混合模型基础上的学习和识别算法。基于上述研究,在MATLAB平台下对整个咳嗽音识别流程进行仿真实验,结果表明基于混合模型的咳嗽音识别性能得到一定程度的提升。
其他文献
软件测试是软件可靠性保障方法中必不可失的一个重要环节。在软件测试过程中,开发人员期望通过不断提高对待测程序模块的测试覆盖率发现更多潜在的软件错误。在实践中,为待测
随着LTE技术的迅速发展,无线接入技术向更高容量、更大覆盖和支持高速移动的方向发展,以及用户需求的不断增长,无线通信网络承载的业务也逐渐由传统的以单一语音为主的模式,
计算机产业的发展推动信息化向纵深发展,在“十二五”软件服务业规划助推下,软件产品将会被大量的应用于社会经济生活的各个领域,人们对于软件产品质量的关注也必将持续升温
近年来,随着全球信息与互联网技术的迅速发展,医学信息化得到了快速的进步,医学信息科学已成为当今信息研究领域的重要分支。医学领域经过多年的发展,已经形成了完备的知识体
随着信息产业的高速发展,软件在各行各业的应用越来越广泛,客户对软件产品的开发周期以及质量提出了更高的要求。软件企业面对持续变化的需求,必须能够快速地响应,才能赢得市
随着计算机硬件和软件技术的快速发展,使得计算机对不规则物体的模拟技术已经渗入到人们日常生活中的各个角落,同时也促进了计算机动画技术的发展。计算机动画技术现已被广泛
网络拥塞很早就已经是人们研究的重要课题,在传统的端到端的互联网络拥塞控制研究方面己取得了很大的进展,而无线传感器网络的兴起对拥塞控制研究又提出了新的挑战。WSN中的
车载网络是近年来快速发展的一个研究领域,其广泛应用使道路上行驶的车辆之间不再是一个个的独立个体,而是整体通过车载网络有机结合在一起的自治系统。车载网络通过车辆节点
近年来,随着科技的发展,医疗技术也在快速的发展。数字化医学图像采集设备不断更新,CT、MR等设备的普及,使得医院每天产生大量的医学影像数据,医生的工作量越来越大,在紧张与高强度
近年来,随着数字音乐创作、收集以及存储技术的快速发展,许多机构积累了大量的音乐音频数据。随着英特网多媒体资料的蓬勃发展,如何对这些音频资源进行有效地组织和管理,使得