基于深度学习的语音识别方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:yyaizy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决复杂环境背景下,采用传统声学模型对语音识别的识别率低的问题,本文结合深度学习理论,分别从语音特征参数和声学模型两个方面进行语音特征提取和识别算法研究。论文研究了人类语音特征,分析人类语音特征参数及其提取原理,研究了LPCC和MFCC两类语音特征参数提取基本算法。通过对MFCC提取算法分析,得出该算法存在明显的高音特征畸变问题。因此,本文采用了EMD分解和分形理论的改进算法修正语音的高频区信息,以达到通过对语音高音区特征量的非线性处理的实现改善高频区信号畸变的目的。本文还研究了MFCC提取算法结合EMD-FD提取算法,相较于单一MFCC提取算法能够更加完整地提取语音信号高频区特征,进而提高了语音识别率。本文还从声学模型建模的角度对深度学习理论以及语音识别中ANN-HMM模型进行了研究。首先,论文分别研究了传统的HMM模型和GMM-HMM模型理论基础,通过仿真对比了HMM模型和GMM模型对语音训练量的性能,论文测试验证了GMM-HMM模型识别效果优于单一的HMM模型,几乎不受语音训练量的影响,提高了声学模型的识别率。然后,论文研究了深度学习理论应用于语音信号处理的可行性和一般方法。然后,论文研究了DNN和LSTM神经网络模型及其训练方法,着重分析了DNN神经网络模型的结构原理、基于受限玻尔兹曼机训练算法和Dropout策略参数调优问题。紧接着,论文研究了LSTM神经网络模型的结构原理、BPTT训练算法及其改进的CSC-BPTT训练算法和解码问题。仿真结果表明:在LSTM神经网络模型中,CSC-BPTT训练算法训练效果和训练速度都要远优于传统的BPTT训练算法。最后,本文通过仿真对比了GMM-HMM模型、DNN-HMM模型和LSTM-HMM模型对长短语音序列的性能和智能化识别的可行性。仿真结果表明:基于深度学习理论的ANN-HMM模型作为声学模型能够取得了优于传统的GMM-HMM模型的识别效果和识别效率。
其他文献
目的:通过对168例中青年慢性乙型肝炎患者住院期间不同的心理反应进行治疗和护理,以提高慢性乙型肝炎患者生活质量。方法:用通俗的语言,以健康需求和个性化心理特征为切入点,以
目的:观察步长稳心颗粒治疗室性早搏的疗效。方法:将72例冠心病室性早搏的患者随机分为步长稳心颗粒组(治疗组)和美托洛尔组(对照组),观察治疗前后临床症状和心律失常改善情
沥青中含有多环芳烃、酰胺、醌、酯和苯酚等环境优先控制物,使得沥青对环境具有潜在的危害性。国内外主要针对沥青烟、沥青中多环芳烃和重金属对水体和土壤的污染进行了相关
大豆是喜温作物,温度在大豆生长发育过程中发挥着十分重要的作用。不同生态类型品种对温度的反应特性不同,且光温互作效应存在差异。大豆的开花期早晚不仅受到光温环境影响,同时受基因的调控;与开花期相关的位点效应在不同光温条件下不同。本研究对不同生态类型大豆品种的温度敏感度进行评估,并利用候选基因关联分析方法挖掘感温性位点,对位点在不同环境的效应进行分析。1.对中国不同生态类型大豆材料进行感温性研究。在20
这两年我国移动互联网用户的激增,越来越多的中小企业都开始在移动互联网平台进行营销推广。但是移动互联网上的营销推广从方法和方式上都和传统互联网端的有不小区别,因此在
目的分析低温等离子扁桃体消融切除术联合腺样体消融术治疗小儿鼾症的临床疗效。方法将70例鼾症患儿随机分为2组,各35例。对照组采用扁桃体去除及腺样体切除术,观察组采用低
分别采用HVB和TPS改性剂制备了高粘度改性沥青,研完了两种改性剂对沥青的物理性能和粘度的影响,并对两种改性沥青的短期老化性能和高温储存稳定性进行了试验评价。结果表明:H
根据虹桥综合交通枢纽工程钢桥面铺装的技术要求,对国产高粘度改性沥青进行了沥青性能和混合料性能的评价试验,并与某进口高粘度改性沥青进行了对比。试验结果表明:国产高粘
目的:探讨数字化摄影(D R)胸片检查对于肺结核的诊断价值.方法:从我所收治的肺结核患者中选取100例进行研究,对他们进行D R胸片检查,并将其D R检查结果与患者提供的C T检查结
构建一套基于产业投资情况、企业内部杠杆率的分析框架,通过VAR模型对重庆制造业企业自身和配套产业投资、行业产出等变化的时间影响范围进行估算。研究发现:在重庆地区,相对