基于深度学习的抗噪语音识别研究

来源 :上海交通大学 | 被引量 : 1次 | 上传用户:zz5616527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2006年Hinton提出的深度学习方法开启了深度学习在学术界和工业界研究和应用的浪潮。深度学习主要是通过模拟生物神经系统对真实世界物体所做出的交互反应,具有强大的自学习能力、非线性映射能力及容错能力。至今从实际应用来看,深度学习在图像、智能语音等领域已经得到广泛的应用;在大词汇连续语音识别系统中,用其取代传统的混合高斯模型为隐马尔科夫模型提供状态后验概率;实验表明与传统的GMM-HMM系统相比,DNN-HMM系统可以相对降低20%甚至30%字错误率。尽管深度神经网络展现出极强的鲁棒性和容错能力,并且在相对无噪声的环境下,取得显著的识别性能提升;然而在实际有噪声环境中应用时,由于模型训练环境与使用环境之间的差异,语音识别系统的性能会严重下降。本文主要从特征空间及模型空间探索在有噪声环境下,基于深度学习的抗噪语音识别系统,提高系统的识别性能。在模型层面,探索一种被称作噪声感知的自适应算法,将当前环境信息加入到输入层,通过深度神经网络自身的非线性处理能力学习环境对语音信号的非线性影响。在特征层面首先将深度神经网络作为一个特征映射和增强的工具,预测干净环境下的声学特征;提出了基于多帧局部动态特征的深度神经网络特征增强算法,并且将噪声感知自适应算法及退火dropout算法应用其中,在Aurora4数据集上与DNN-HMM基线系统相比可以降低绝对2.1%的字错误率;然后将多任务联合优化的结构引入到基于特征增强的语音识别算法中,并提出改进了模型结构,这样用于降噪的特征增强网络与识别网络就合并到一个多任务联合优化的框架下,当应用噪声感知自适应算法的情况下,可以取得绝对2.7%的性能提升。
其他文献
地被菊作为东北地区重要的观赏花卉,同时具备绿化、美化、彩化的综合功能,园林应用前景极为广阔。低温胁迫不但影响了地被菊的观赏性,缩短了观赏周期,也限制了地被菊的种植区
农村商业银行在我国农村金融体系中占据重要地位,为我国农村金融市场的发展与“三农”问题的缓解作出了重要贡献。农村商业银行自成立之初便承担着服务县域经济、支持“三农
压裂是提高页岩储层渗流特性的有效手段。但并不是所有泥页岩层段都适合进行压裂施工。实践表明,射孔层段中有50%处于基本废弃状态,并不对生产有多少贡献。因此,前期进行合理的压前评价,不仅可以更清晰的认识在实际生产中可动用的资源量,并且可以合理的选择压裂层段,使压裂达到最佳效果。据目前的认识,压裂时能形成复杂的裂缝网络而不是单一的双翼型裂缝更能有效的改造页岩储层。页岩储层在压裂时能形成复杂的裂缝网络,需
目的主动脉缩窄伴弓发育不良病变谱广,解剖结构个体差异大,目前其外科治疗存在争议,术后远期并发症率、生存率仍欠理想。本研究第一部分探索了主动脉缩窄伴弓发育不良病理谱
2008年经济危机爆发后,发达国家开始意识到制造业对国家发展的重要性,“工业2.0”、“工业4.0”和“再工业化”等政策纷纷出台,推进制造业转型。在这样的背景下,中国开始审视
在地下水数值模拟中,经常需要对重点区域进行加密,来精确地刻画该区的水头变化,溶质运移等情况。基于MODFLOW的局部网格加密技术(Shared Node Local Grid Refinement)LGR仅需
焊接机器人是一种工业中常用的工具机器人,该焊接机器人的机械本体采用以SCARA为基础的5自由度结构,该机器人采用圆柱坐标且其在效率高,结构好的基础上,加入了具有多自由度的
目的:通过收集近10年来有关中医药治疗单纯性肥胖和超重的文献,对其中的中医证型、用药进行统计分析,探讨其中医辨证、用药及治疗规律,为单纯性肥胖和超重的中医治疗提供依据
社交媒体作为一种新兴的信息技术,对于深入推进数字乡村战略,加快发展“互联网+农业”模式,进而更好的解决三农问题具有重要作用。然而,我国仍有相当数量的农民,受限于自身和
·津田’芜菁色素合成受UV-A光诱导,受UV-B/蓝光复合光的协同效应。因此我们认为UV-A信号转导的光受体不同于拟南芥中发现的蓝光/UV-A光受体(隐花色素),是一种新的受UV-A特异