语音识别中神经网络声学模型的说话人自适应研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:xiaogege0451
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对语音识别系统中测试的目标说话人语音和训练数据的说话人语音存在较大差异时,系统识别准确率下降的问题,提出一种基于深度神经网络DNN(Deep Neural Network)的说话人自适应SA(Speaker Adaptation)方法。它是在特征空间上进行的说话人自适应,通过在DNN声学模型中加入说话人身份向量I-Vector辅助信息来去除特征中的说话人差异信息,减少说话人差异的影响,保留语义信息。在TEDLIUM开源数据集上的实验结果表明,该方法在特征分别为fbank和f MLLR时,系统单词错误率WER(Word Error Rate)相对基线DNN声学模型提高了7.7%和6.7%。
其他文献
在众多作者和读者的关爱之中,本刊编辑发行第一百辑了。史念海先生主编第一辑《中国历史地理论丛》问世于1981年,于今竟有三十年矣。32开188页、B5开160页、A4开160页的变化,
结合先进电子显微术和纳米压痕分析,对低活化马氏体CLAM钢的辐照行为进行了研究。在室温下对CLAM钢进行了单一注D+、单一注He+以及先注D+后注He+三种方式的离子辐照。纳米压
学生的认知基础与发展需要是影响复习课教学设计与实施的关键要素。文中以"如何验证无明显现象的化学反应"为例,梳理了依托实验探究化学反应发生的基本思路,基于学生认知基础
高职院校辅导员处于学生管理工作的第一线,与学生接触最为紧密,在整个心理危机干预中具有独特的优势。实质上,高职院校辅导员在心理危机干预中的人文关怀作用并未真正发挥。
军事英语的核心是职业目的,着重提高学员军事英语综合应用能力和军事外交综合素质。本文探讨了模块化教学在军事英语教学中的可行性,通过对课程结构、教学内容设置及教学方法
有效的铁路货运服务质量管理可以防止小问题演化为不可解决的大问题,构建铁路货运服务质量问题管理模型,其主要环节包括问题筛选、归因分析、方案制定、方案执行与反馈等。通
目的:研究短病程2型糖尿病患者经短期胰岛素强化治疗获长期缓解的预测因素。方法:入选36例病程不超过半年的初诊2型糖尿病患者,给以2周的胰岛素强化治疗。强化治疗前及结束24
<正> 一、振动、连排离心机特点该机型号为“MGS”,是最新研究、设计的为回收微细粒金属、非金属矿物的多段选别重选设备。其选别粒级下限可至1—2微米,从室内至现场对不同的
威廉·勃特勒·叶芝是伟大的诗人,他的诗歌中有着大量的模糊语言,译者要正确地理解其真正的意义,还要最大限度地保留原文的特色,如果目标语言与源语言之间语境相互矛盾,那么
建立了弹性石英毛细管柱气相色谱分析工业1,2-丙二醇含量的方法。通过不同类型检测器、不同固定相和不同色谱操作条件的对比试验,对方法的准确性及影响因素进行了研究,并对样