基于语种对抗训练的跨语种说话人识别研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wtmw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科技的高速发展,人们越来越多的关注到生活中的信息安全和身份认证,个人信息、保密信息的泄漏不但对个人的人身、财产安全造成严重威胁,也会对社会的发展带来不利的影响。目前,身份证件、口令密码等传统的身份认证和鉴别的方法已经不能完全满足人们的需求,而基于生物特征的身份鉴别技术以其方便、可靠等特性,越来越多的得到了人们的关注。语音作为人们日常生活中交流沟通最直接、最便捷的方式,其中衍生出的说话人识别技术也成为研究的热点和重点随着国际化浪潮的推进,单一的语言已经完全不能满足人们的日常生活、工作和学习的需要。我国幅员辽阔,是一个多民族融合的国家,有着丰富的少数民族语言和地区方言,这种情况在我国南部和西部的粤语、藏语、维语等与中文普通话差异较大的方言和民族语言流行的地区尤为明显,跨语种的说话人识别问题在身份认证、公安刑侦、国防安全等领域尤显突出。本文针对跨语种的说话人识别这一问题提出基于语种对抗训练的跨语种说话人识别算法。利用迁移学习中对抗训练的方式提高从语音中提取说话人信息的能力,进而提高对跨语种任务中说话人识别的精度。本文的主要工作和贡献包括以下几点:(1)将卷积神经网络和时延神经网络相结合,应用于说话人识别的任务上,利用深度神经网络强大的表达能力,构建了一个可以实现端到端识别说话人的网络模型,并在跨语种的说话人识别数据上验证了其有效性。实验证明卷积-时延神经网络可以有效提取语音中的说话人信息,在同语种和跨语种的说话人识别任务中均能有效使用。(2)提出了基于语种对抗训练的说话人识别算法。利用迁移学习中对抗训练的思想,在基于深度神经网络的端到端的说话人识别网络中使用语种对抗训练的方法训练网络,在训练中加入语种监督信息。实验证明,该算法继承了深度神经网络能有效提取说话人信息的特点,同时能将网络中隐藏层提取的特征信息排除语种信息干扰,有效提高了跨语种说话人识别的精度。(3)利用三元损失函数训练深度神经网络。使用三元损失函数替代常规网络训练中的交叉熵函数,将不同说话人信息和不同语种之间的信息同时引入到网络训练中,进一步提高跨语种说话人识别的精度。
其他文献
本文依托于国家“深部探测技术与实验研究专项(Sinoprobe),”下属第一个项目的子课题-“青藏高原及华北阵列式区域大地电磁场标准网示范性实验研究sinoprobe-01-02”,以在鄂
制定合理的水库汛末提前蓄水方案,对于提高水库兴利效益有积极作用。由于处于汛期到非汛期的过度阶段,涉及到防洪、兴利等多方面因素,考虑水库调度管理体制要求,采用二层规划
钠离子电池由于具有资源丰富、价格低廉和环境友好等特点,在大规模储能领域具有潜在的应用优势。目前对钠离子电池的研究主要集中在电极材料的开拓和性能提升方面,但对于电解质溶液的研究鲜有报道。同时,由于金属钠具有较高的还原性,导致其与很多有机溶剂都会发生反应。因此,优选出化学及电化学稳定的电解液组分对发展高能量密度和长寿命的钠离子电池十分重要。本论文选取了不同的非水有机溶剂(碳酸酯类和醚类)和钠盐,系统地
碳基量子点(Carbon dots,CDs),是一种包含sp2碳结构和官能团的零维纳米材料。CDs由于其表面效应和量子限域效应而具有许多独特的发光性质,包括荧光、电致化学发光、化学发光
非线性共轭梯度法具有迭代简单、存储小、计算快等优点,因此这类方法是求解大规模无约束最优化问题的一类非常重要的方法.为了获得理论性质和数值结果更好的共轭梯度法,基于D
脱欧是当今国际上的一个重要话题。本文是基于英国前首相特蕾莎·梅关于托利党脱欧会议讲话的视频模拟英汉交替传译口译实践报告。会议的流程是首先由一名政府官员进行了大约15分钟的会议致辞,接着由特蕾莎·梅发表主旨讲话,主要内容是关于英国脱欧等热议话题。笔者从国外知名视频网站上选取了本段英文政治会议演讲素材,用作此次口译实践的原材料,并最终完成了视频的播放、口译、音频的录制以及案例分析。本文共分为四个章节。
在经济发展的过程中,出现环境污染问题是难以避免的。建立环境公益诉讼、扩大社会公众参与环境治理的权利,是当今世界各国的通行做法。我国通过修订三部法律,发布两个司法解释和其他相关文件,逐步建立起环境公益诉讼制度。原告资格这一问题,是环境公益诉讼的核心。依据我国现有的法律规定,有权提起环境公益诉讼的主体仅为检察机关和符合条件的环保组织。如今我国的环境公益诉讼司法实践进展缓慢,案件数量远低于预期,特别是,
随着大数据时代的来临,数据已爆炸式增长。模糊神经网络常用于模糊推理运算中,如何改进传统的模糊推理算法,以保证在大数据环境下模糊推理的有效性,已经成为智能信息处理领域
水厂建设是关乎国计民生的重要工程项目,是城市的“生命线”系统之一,社会发展快意味着人们对水的需求也在增加。当一座城市或某个区域现有供水能力无法满足其发展需求时,需要通过新建或改扩建水厂来加以解决。水厂应急扩建工程项目建设成为供水企业在无法建设新水厂或时间紧迫时解决供需矛盾的首选方案。在实施水厂新建或改扩建工程时,存在各种风险,因此加强对水厂新建或改扩建项目风险管理更具有现实意义,是每个供水企业都会
渭沱水电站位于重庆市合川区渭沱镇,距涪江汇入嘉陵江的汇合口约23km,是以发电为主,兼航运的综合水利工程。渭沱电站原装有两台灯泡贯流式机组,设计水头:Hp=8.5m,最大水头:Hm