基于深度神经网络声学模型的说话人自适应技术研究

来源 :南京邮电大学 | 被引量 : 1次 | 上传用户:luxiliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度神经网络(Deep Neural Network,DNN)技术在语音识别(Auto Speech Recognition,ASR)领域的应用快速发展,已经成为了ASR领域中主流的声学模型建模技术。然而,生产环境中的目标说话人语音与实验环境中的训练数据说话人语音存在的差异,导致的模型不适配的问题,同样出现在了基于深度神经网络的声学模型中,当语音识别系统识别一个不在训练数据中的说话人语音时,系统识别性能会显著下降。本文主要围绕说话人自适应技术对基于深度神经网络的语音识别系统的性能的影响进行详细研究。主要从说话人自适应技术和深度神经网络模型相结合的技术角度进行研究,论文的研究内容如下:1、概述了深度神经网络模型的研究进展,并详细介绍了基础的神经网络模型的结构原理、模型训练的具体步骤和关键过程的数学理论,并给出常见问题的处理方法。然后,构建了基于HMM-DNN模型和HMM-LSTM模型的语音识别系统,作为本文的基线系统,并通过相关实验分析了基线系统的识别性能。2、本文在HMM-DNN模型的基础上,提出了一种新的基于深度神经网络的说话人自适应技术和对应的模型结构。该模型借鉴了声纹识别和神经网络dropout的思想,在基线系统的声学模型中加入带有正则系数的说话人鉴别性i-vector矢量,使得声学模型适应因不同说话人带来的语音差异性,较好的识别其通用的语义信息。然后,通过相关实验证明了该技术方案可以有效的提升ASR系统的识别准确率。3、本文继续研究了循环神经网络(Recurrent Neural Network,RNN)中有良好表现的长短时记忆网络(Long Short Term Memory Network,LSTM)模型。提出了一种在LSTM声学模型中加入带有正则系数的说话人鉴别性i-vector矢量的网络模型,该模型可以更好的适应不同说话人的差异信息,提高模型的泛化能力,从而提升系统性能。通过相关实验和结果分析,证明了两种基于深度神经网络的声学模型在引入带有正则系数的说话人i-vector特征信息后,均在一定程度上提高了系统的识别性能,实现了识别准确率的提高。研究结果也表明本文提出的基于深度神经网络声学模型的说话人自适应技术方案的合理性和有效性。
其他文献
采用实验与数值模拟相结合的方法,对圆柱壳结构在水中受到柱形TNT炸药产生的冲击载荷作用下的动力响应过程进行研究.对不同装药量、爆炸距离和爆炸角度的影响分别进行了实验,利
摘要:为贯彻我院“夯实基础、注重能力、突出实践、鼓励创新”的教育教学理念,进一步提高教学质量,把培养高素质、“应用型”人才作为最终目标,本文针对《电力拖动自动控制系统》这门课程的特点,对教学内容、教学方法、课程考核方式等方面进行了一系列改革探索,达到了良好的效果。  关键词:电力拖动自动控制系统;实践教学改革  中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2018)14
黑鲷(Acanthopagrus schlegeli)属鲈形目、鲷科、鲷属,因其适应性强、生长迅速、营养价值高等特点,受到许多消费者喜爱,具有广阔的市场前景。海水网箱养殖和海水池塘养殖是主要且常见的两种黑鲷养殖方式。近年来,随着养殖种类增加、养殖密度不断提高及海水中的病原体数量不断增加,导致养殖环境恶化,细菌、病毒、寄生虫性疾病爆发。严重影响养殖的经济效益,阻碍了黑鲷养殖业的健康发展,同时,给黑鲷
医患之间有着既共同协作又相互对立的关系。然而,随着经济发展与社会转型,医患互不信任及相关冲突日益凸显和严重,并呈现暴力化倾向与互害发展模式。医患关系紧张、暴力事件
为解决用Euler方法求解多种介质的流体力学问题时,物质的输运中维数分裂算法容易出现重复或遗漏的问题,以Youngs界面重构技术为基础,输运步中采用维数不分裂算法,除了考虑相
本文主要分析了三维设计岗位应具备的能力结构,并对空间想像力、素描与色彩应用能力、平面图像处理软件应用能力、3Dmax、Maya软件应用能力、计算机软件应用能力和创新思维能
锚喷技术在岩质边坡支护中发挥着关键性的作用。锚喷技术在岩质边坡支护中主要体现在三方面,分别是锚杆、钢筋网及喷射混凝土,在岩质边坡支护中运用锚喷技术可以提高边坡施工
城市雕塑是彰显城市文化的重要载体,编制城市雕塑规划是指导城市雕塑有序建设的重要工作。国内少数城市在编制城市雕塑规划领域都做了一定的探索,实践中也暴露出如法律定位不
目前,大部分建筑物均为钢筋混凝土框架结构,而为了减轻钢筋砼框架、框剪结构楼体的荷载,填充围护墙多采用轻质砌块、砼空心砌块等。这些材料具有容重轻、隔热保温性能好、施
本文以三菱FX系列PLC对LED点阵显示屏控制,实现静态显示为例,来阐述利用PLC对点阵显示器进行静态显示控制的原理及编程应用。