基于多任务神经网络的语种识别研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:asdf20091234567889
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的飞速发展,语音领域研究也取得了巨大的突破。语种识别技术作为语音研究的首要步骤,是决定语音后端效能的关键。现阶段的语种识别方法多是基于语音音素的语种识别,该方法须对语料进行音素标注。而基于深度学习神经网络的语种识别仅需利用声学特征组合,不需要借助语料音素信息便可实现高精度的语种识别。在实际应用场景中,基于神经网络的语种识别模型小巧且识别效果显著,可有效应用于其它语音研究的前端,提高语种识别的实用性;与此同时,现今的多语种环境数据规模庞大,深度神经网络利用大规模数据进行训练大有优势。因此,本文通过改进传统声学特征,提出了基于语速特征的端到端语种识别模型和基于多任务学习的方言语种识别,旨在利用神经网络强大的计算能力、特征提取能力等使得语种识别的方法更加高效、实用,进而提高模型的整体性,改善语种识别的精度和准确率,从而达到保护语言文明、促进语音发展的目的。本文首先针对国际语种识别问题,通过深度神经网络,构建了基于语速特征的语种识别模型,进一步针对相似性高、易混淆语种,以方言语种识别为代表提出多任务学习方法学习其中的隐含特性进行方言语种识别研究。主要工作如下:1.已有研究基于语音音素的语种识别方法,对原始音频的基层声学特征进行提取,通过GMM-HMM模型(高斯混合模型和隐马尔科夫模型)结合音素判别器进行语种识别,其与语音识别模型在本质上相似。针对涉及到音素特征,在实际应用中复杂度太高且不易实现的问题,本文首先提出了基于深度神经网络的端到端语种识别模型,该模型通过提取原始音频的两组底层声学特征,梅尔倒谱频率(MFCC)和Fbank,并根据不同语种的语速特性差异,对原始特征进行创新改进,形成新的组合特征,即MFCC、Fbank、语速特征。其次,通过训练卷积神经网络和递归神经网络搭建了CLSTM模型进行语种识别,并在国际公开的Common Voice数据集上抽取五个语种进行实验,实验结果显示本文提出的深度神经网络端到端模型识别准确率达90%。2.方言语种识别作为语种识别的子问题,其研究与语种识别密切相关。且方言语种具有地域性特点,彼此之间的相似性更近,易于混淆。针对相似语种难以区别以及国际语系划分下语支语族分类困难的问题,本文通过对方言语种识别展开研究,提出了基于多任务学习的方言语种识别方法。利用多任务学习挖掘相关任务的隐含特性,分别搭建基于参数硬共享的多语种方言语种识别模型和基于参数软共享的辅助任务方言语种识别模型,并在科大讯飞方言数据集上进行单任务及多任务对比实验,实验结果显示,本文提出的多任务方言语种识别模型针对十种方言识别率可达82%。
其他文献
创新能力是具有创造性的有价值的东西或新观念的人格特征在能力上的反映,是人类一种与生俱来的潜能。在国际竞争日益激烈的今天,世界各国为了提高本国国力、适应时代发展的需要
背景和目的:依据2014年WHO公开发表的第4版《女性生殖器官肿瘤分类》,近年来对宫颈癌前病变的定义使用“宫颈上皮内瘤变(Cervical intraepithelial neoplasia,CIN)”和“-鳞
<正>作为一个助人的专业和职业,社会工作可以说与贫困问题有着天然的血缘关系。正基于此,2017年民政部发起的"牵手计划",不能仅仅看作是社会工作实务领域的拓展,在某种意义上
SAPERP系统(下文简称:ERP系统)作为核心业务系统涵盖人资管理、财务管理、物资管理、设备管理、项目管理等业务范围,系统中存储了企业大量的核心业务数据、企业机密和敏感信息,
利用一定边界条件下的Maxwell方程和修正的Landau—Lifshitz—Gilbert方程,对磁性层,非磁性层/磁性层(M/C/M)三明治多层膜中出现的巨磁阻抗效应进行了理论分析.对于单轴横向磁各向异
圆筒状合成彩虹全息图可以将各种二维图象合成为伴有动作的360度立体动态影像,液晶技术的引入应用空间更为广阔,使用多路合成彩虹全息图复制系统解决了这种全息图的批量复制问
随着我国社会经济的发展,国有企业将会面临巨大的改革,而党建工作是事业单位工作中最重要的部分之一。新形势下,贯彻实施党的十八大精神,促进事业单位党建工作,按照战略来完
日前,一些来自于淮安一个网瘾治疗中心的孩子,进行了一次“有预谋”的逃亡。他们在夜晚将值夜教官绑了起来,从教官身上取到了大门钥匙,趁夜出逃。不过,最后还是被警方发现。(6月7日《扬子晚报》)  这样的情节,让我想起一部2008年上映的美国影片《逃离改造营》,这部影片说的是一批问题少年被他们的父母送到一座位于斐济的偏远小岛上的营地里进行一项康复计划。其实那里是一个类似监狱的训练营,那些少年在那里受到了
针对卫星信号中断后PPP需要重新收敛的问题,根据对流层延迟参数在短期内变化不大的特点,利用PPP中断前估计的比较精确的对流层延迟参数作为先验信息,提出了一种附加先验对流层信息约束的PPP模型加快PPP的重新收敛。实验结果表明,附加先验对流层信息约束模型的PPP重新收敛过程明显快于传统模型。附加先验对流层延迟信息的标准差越小,约束条件越强,PPP的重新收敛就越快。
摘要:科学课是小学生的一门必修课,它是让学生体验科学过程,理解科学本质,领会科学精神、态度、价值观、培养创新精神和实践能力的主要课程。本文通过对牡丹江市几所小学的调查了解,提出了科学教学中学生探究素质培养存在问题的原因及解决的策略。  关键词:科学教学;创新精神;探究素质    2009年3月,因学校开展双师教学,有幸来到市先锋小学,从事科学课的教学。通过几个月的教学和对牡丹江市先锋小学、立新小学