基于深度神经网络说话人识别方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:TRACY101688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度神经网络(Deep neural network,DNN)技术的发展,其在机器学习和模式识别领域有着广泛的影响,特别是在图像识别和自动语音识别(ASR)方面的成功应用。这鼓舞着我们继续探索DNN在其他方面的应用,这些领域有着部分相同的功能和过程。然而,其在一个新的领域的应用,需要依赖新的知识来提高性能。本研究重点研究了基于深度神经网络的说话人识别任务。所谓说话人识别,又被称为声纹识别技术,主要任务是通过待测试语音来判断对应的说话人身份。
  在说话人识别中,传统上采用的是基于Mel频率倒谱系数(MFCC)特征的高斯混合模型(GMM)框架,每个说话人模型都是基于GMM进行建模的,它是根据语音信号的短时平稳性进行分析建模,是一种生成式的模型,不能很好的表征说话人特征。为了直接考虑说话人的识别特征和模型,神经网络是最佳的选择之一。特别是随着近年来深度神经网络技术的发展,其特征提取和模式识别越来越受到重视。
  基于上述的背景,本文研究了一种基于深度神经网络的说话人识别系统,使用这种方法,相较于传统的方法可以更好的进行说话人的识别,主要的研究工作如下:
  文章首先介绍了语音信号的预处理步骤,方法及意义,具体分析了两种具有代表性的语音特征的得到方式,并进行对比。然后介绍了说话人识别模型的具体估计方式。具体介绍了EM算法估算高斯混合模型,以及采用MAP算法估计通用背景模型。介绍了I-Vector模型的计算方式。最后对传统的I-Vector模型进行改进,提出了一种基于DNN的I-Vector模型。因为神经网络具有从抽象的数据中学习的能力,采用深度神经网络来提取对说话人的特征进行加工。具体讲述了这种方法的理论依据,以及对以往的模型进行改进的步骤及方法。采用新的估计算法代替最大后验概率建立说话人模型。并分析不同的激活函数对说话人模型造成的影响,从而采用最适合的激活函数。为解决过拟合问题,在神经网络中增加dropout层。针对I-vector模型中困难的矩阵估计,提出一种新的方法代替,并具体的演示。最终训练出基于深度神经网络的说话人模型。并通过具体实验,与传统的I-Vector模型,GMM-UBM模型进行对比,验证其实用性。
  实验中所采用的语音库主要以Timit语音库和自建的语音库进行实验,对文章中提到的基于深度神经网络的说话人识别系统进行实验分析,主要采用不同数量的样本,不同长度的样本以及不同性别等数据对系统进行测试。并且与传统的GMM-UBM和I-Vector模型进行对比,测试其是否对说话人识别成功率有所改善。最后在不同的噪声背景下,分析这种方法的识别率和噪声的鲁棒性。最后的实验表明,本文所提的方法确实对传统的I-Vector方法有所改进,识别效果有所提升。证明了文中所提方法的合理性和实用性。
其他文献
一体化注塑机料筒采用电阻丝加热,自然风冷却降温,存在能耗损失大、升温速度慢、热恒定性差等不足,电磁感应加热具有环境污染小、加热效率高、预热时间短、温度容易控制以及非接触式加热等优点。因此。本文在广东省中山市科技计划项目“高性能一体化立式注塑机研制及产业化”(2017A1031)的资助下,采用电磁感应方式,研究并设计一体化注塑机电磁感应加热系统。本文主要研究工作和取得的成果如下:(1)根据一体化注塑
全球商业的高速发展促使了船舶制造业的飞速发展,船舶日趋大型化。由于大型船舶自身惯性大,航行控制不稳定、泊船操作困难等问题,港内大型船舶在靠泊过程中容易出现事故,因而船舶的自动靠泊技术已成为该领域热门研究问题。针对大型船舶港内自动靠泊过程中,低速路径跟随控制效果差、能耗大和泊位外镇定控制等问题,本文重点探讨了其中两个关键点:低航速下的航迹保持控制和位移无超调的泊位外镇定控制,基于对这两个控制过程的研
学位
中国港口集装箱吞吐量排名不断提高,原有作业系统的实时性和安全性急需进一步提高。机动车进闸开始,需要对运输货物实现全面监控,并且实时掌握查看车辆进闸期间所有运动轨迹,实现进闸车辆的全面感知、自动识别的无人化作业。为了实现对进闸及场区车辆车牌信息的自动采集及闸口无人化监控系统的建设,本文重点研究集装箱码头内集卡车牌和标准机动车车牌号视觉识别算法研究及实现。针对具体的应用技术,本文主要从目标区域定位、字
学位
下肢穿戴式辅助运动设备在康复助残、国防工业等领域有着重要的应用。越来越多的研究者和工程人员开始投身于智能化辅助器械的研究与开发。步态识别是这个领域的重点研究内容。下肢表面肌电(SEMG)信号是各块肌肉活动时产生的生理上的电信号。该信号的产生超前于肢体运动状态的变化。这种特性使得下肢SEMG信号能够反映人体的运动意图从而有助于器械的自主控制。本文根据下肢SEMG信号反映的信息,对步态周期中的各个步态
很多复杂系统都可以被建模成由点和边组成的网络模型,传统的数理工具很难分析这种尺度大、交互关系复杂、高耦合的对象,复杂网络理论因此而逐渐兴起,并成为人们研究和分析复杂系统的有力工具。网络所承载的功能由网络的拓扑结构决定,网络拓扑结构的鲁棒性决定了网络功能的鲁棒性,因此网络的鲁棒性提升研究逐渐成为复杂网络领域的研究热点。现有网络鲁棒性提升策略聚焦在如何优化网络拓扑来尽可能地保持网络遭受到攻击(或发生故
学位
当今时代科技水平飞速发展,传感器技术和人工智能技术被广泛应用,水面无人艇(Unmanned Surface Vehicle,USV)越来越智能化、自主化。水面无人艇作为一种水上无人驾驶平台在执行任务时,由于受无人艇负重、航速、航行环境干扰等因素的影响,无人艇的操纵性能会发生变化,因此需要一个具有适应性和鲁棒性的控制模型以及精良的控制系统作为无人艇运动控制的支撑。双螺旋桨水面无人艇具有较好的操作性与
目标检测算法是近几年来计算机视觉研究领域的一大热门。随着深度学习的发展,越来越多基于深度学习的目标检测算法逐渐登上舞台,以远超其他视觉检测算法的性能被广泛应用在生产生活中,加快了社会智能化的进程。目标检测包含模式识别、图像处理、深度学习等许多领域的前沿知识,使其成为一项具有挑战性的研究课题。考虑到现阶段列车异物检测主要基于人工肉眼检测,耗费人力且效率低下,本文将基于改进YOLOv3目标检测算法用于
学位
随着经济全球化的不断深入发展和我国“走出去”制造企业的逐渐增多,企业之间的合作生产以及兼并收购日益普遍,分布式制造成为常见制造模式。分布式调度问题作为分布式制造的重要环境,以工厂之间的合作生产等为背景,研究工件在工厂间的分配以及各工厂内的加工顺序,利用高效的优化技术与调度方法,实现调度指标最优化。本文研究分布式不相关并行机调度问题(DUPMSP),包括单目标DUPMSP和多目标DUPMSP,设计了
集装箱码头智能化是指在码头区域采用计算机视觉、深度学习等技术,提高码头生产运行的自动化,是人工智能等新兴技术的一个重要应用场景。随着计算机视觉技术的深入发展和广泛应用,集装箱码头这样的传统工业场景下也逐渐开始利用计算机视觉检测和识别技术。但由于码头前沿环境的图像清晰度、光照变化、相机畸变、集装箱尺寸和箱号位置各异等因素,使得码头场景下利用深度学习等技术实现码头箱号自动识别仍有很大的挑战性。本文基于
学位
随着世界各国把国防与外交重点不断向海洋转移,探索海洋、开发海洋资源成为了各个国家的关注重点,凭借无人化、智能化等优点,无人艇成为海上活动的重要载体。路径规划是无人艇运动控制的核心技术之一,标志了无人艇的智能化水平,但目前缺少结合实际航道规则进行无人艇路径规划的算法研究。本文在此基础上提出了一种新的遵循航道规则的无人艇全局路径规划算法,同时优化了局部路径规划算法。主要从以下几个方面展开研究工作:(1
学位