基于深度循环神经网络的语音识别算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lanyao88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一种实现人机自然交互的智能技术,在现在这个电子智能产品普及的社会中,它的应用十分广泛。通过语音识别,我们能够进一步的解放我们的双手,提高人机交互的效率。语音识别的发展日新月异,从一开始的孤立词识别,再到连续的大词汇量语音识别,再到远场语音识别。语音识别领域的研究人员一直在不断攻克新的问题与障碍。如今的语音识别技术,在语音清晰且距离够近的情况下,已经能够达到相当不错的应用水准。但是远场语音识别在语音识别的领域中依然是一个相当大的挑战,远场语音数据中存在的混响、回声和噪音等都对系统的识别性能造成了影响。近年来深度神经网络给很多技术领域带来了新的突破,它在语音识别上的应用也大幅提升了语音识别的识别率。而深度循环网络由于其自身网络中存在有向环的结构,使得循环神经网络能够拥有记忆,从而拥有了对动态时序建模的能力。在论文中,对于如何在远距离的情况下进行准确的语音识别这个问题,将以深度循环神经网络为切入点展开研究。本文的主要工作如下:(1)介绍了语音识别中的基本技术,对语音识别中的预处理过程如语音分帧、端点检测等进行了详细说明;对经典的语音特征如MFCC、LPCC等做了详细介绍,并对特征参数的提取过程进行了推导;描述了远场语音识别中的基本技术,对远场语音识别中语音增强技术的必要性进行了阐述,并对多通道波束形成算法进行详细介绍。(2)研究了传统的语音识别算法模型GMM-HMM模型以及基于深度循环神经网络的声学建模。使用beamforit工具包对远场语音数据进行波束形成,利用kaldi框架在AMI数据集上分别建立了基于GMM-HMM、LSTM、改进LSTM的远场语音识别系统。(3)研究对比了GMM-HMM与LSTM的不同之处以及模型性能差异。另外还在模型结构、特征参数等方面深入对比了LSTM的性能表现,在AMI数据集上的实验表明:3隐含层的LSTM模型与GMM-HMM模型相比在WER值上有6.2%的相对降低;4隐含层的LSTM声学模型与3隐含层的LSTM声学模型在WER值上有11.2%的相对降低;在4隐含层的LSTM声学模型中,融合特征PLP+MFCC取得最佳的识别效果。针对深层LSTM的梯度消失问题,使用改进的LSTM网络结构,增加一个层控制门改善模型的性能,在AMI上的实验验证了改进方法的有效性。
其他文献
随着计算机软硬件技术发展,三维模型在动画、机械、医疗等领域应用更加广泛,三维模型数量也越来越多,三维模型检索领域也面临着更多的挑战。很多学者对三维模型检索技术进行
粘弹性流体及粘弹性流体的控制技术被广泛应用在工业生产中。近些年来,高性能计算发展迅速,开展关于粘弹性流体大规模并行数值模拟的研究,可以为流体工程计算提供有效的科学
随着全球对室内高精度定位问题的重视,超宽带(Ultra-Wideband,UWB)定位技术逐渐兴起,成为室内定位技术的主力军。然而,在一些复杂环境中由于障碍物密集和地势复杂等因素,导致
全波形星载激光雷达具有穿透性强、精度高等特点,并且全波形数据可以直观地反映地面探测目标的垂直结构和高程信息,目前已经广泛地应用于森林蓄积量估测、生物量估测、极地冰
在工业生产设计中广泛存在未知频率周期性干扰问题,持续的周期干扰会造成控制系统的不稳定甚至崩溃,并且会给系统带来误差,从而造成不必要的经济损失。为了解决这类问题,对周
压电俘能器是一种将周围环境振动的能量转为电能并加以储存和利用的装置。因其具有转换效率高的优点而受到广泛关注,随着微纳机电系统的发展,俘能器成为替代传统更换式蓄电池的方案之一。基于悬臂结构的压电俘能器结构简单,易于设计和加工。而且其整体结构具有较低的固有频率,容易与周围环境的振动产生共振,成为了研究关注的焦点。且在悬臂结构上附加集中质量可以对俘能效率进行增强。然而,确定的结构只能使其在固有频率附近范
背景肝脏恶性肿瘤的病发率和病死率极高。根据目前最新的文章研究,肝细胞癌(HCC)在所有的癌症中病死率是排名第四,也同时是全球排第六的最常见癌症。更有甚者,由于慢性乙型肝炎在中国的高发,中国诊断的肝癌病人占有全球肝癌病人的百分之50。早期肝癌并无明显症状,而我国的体检并不像其他国家那么普及,大多病人确诊时已是癌症晚期阶段,已丧失手术机会或者预后极差。而在肿瘤化学治疗方面,HCC并不如乳腺癌或肺癌那样
近年来,太赫兹超材料吸收器已成为研究热点。但以往的吸收器带的研究往往是固定频点,其吸收率难以灵活调谐,而石墨烯的出现打破了传统的金属-介质-金属吸收器,通过构造石墨烯
海面风场是上层海水运动的主要动力来源,是海洋学的重要物理参数,在区域及全球气候变化中起着举足轻重的作用,对于海面风场的准确预测有利于全球天气预报的发展以及海浪的预
在当前智能制造成为我国工业制造业发展重点的背景之下,发展出能够与之匹配的工业产品外观设计成为现阶段需要解决的问题。激光打标机作为迅猛发展的激光行业的一员,具有非常