复杂环境下特定说话人的语音识别研究

来源 :武汉纺织大学 | 被引量 : 2次 | 上传用户:allviolet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用某一特定说话人的语音来对这个人的身份进行识别的技术叫做说话人识别技术。我们所研究的是说话人识别中的与文本无关的说话人确认系统。在信息技术高速发展的今天,说话人确认已经得到了很全面的研究和成功的应用。文中介绍了说话人识别所需要用到的语音信号的特征参数并对他们进行了仿真实现。
  虽然在实验环境中说话人研究已经能取得了很好的研究和成果,但是在运用到现实生活中的时候,因为复杂的环境噪声的影响会造成系统识别性能的急剧下降。本文针对这个问题,分为两个方向研究了如何提高说话人识别系统在环境噪声下的鲁棒性的方法:
  首先介绍了基于特征参数的噪声鲁棒性算法,在这类算法里面着重研究分析了Delta参数、谱减法、PCA和RASTA滤波等在说话人识别中常用的消除噪声影响的技术。用HTK工具箱分别对语音信号提取MFCC参数和它的Delta参数、Delta-Delta参数,用来对语音信号进行识别,发现Delta参数可以提高系统的识别性能。在介绍谱减法时使用谱减法对语音进行了增强,由于谱减法对语音加强之后会出现“音乐噪声”,引入了改进的谱减算法。PCA可以对参数进行降维和去除一部分噪声,本文对PCA主轴和数据方向的一致性、PCA变换对数据的扩展性能和数据PCA的降维有益于GMM模型分类等方面进行了验证。在对RASTA的研究过程中,将其用于PLP参数的滤波,在实验中,对干净和带噪语音信号分别进行PLP和PLP-RASTA特征参数的提取,发现干净语音和带噪语音所产生PLP-RASTA参数的谱图要比两者的PLP参数谱图相近,证实了PLP-RASTA参数的鲁棒性。并基于特征参数的融合提出了一个新的抗噪特征参数,并用实验数据证实了它的有效性。
  然后介绍了基于模型的对噪声进行补偿的技术,也就是在GMM模型的基础上引入UBM的GMM-UBM模型。并对SVM模型进行了研究,虽然SVM是很优秀的分类模型,但是由于声道参数不适于直接用于SVM的分类,所以论文中最后将SVM和GMM模型进行了混合,并引入了GMMsupervector的技术,很好的提高了系统的识别性能。本文用TIMIT语音库中的纯净语音和NOSIEX-92库中的噪声作为训练和识别的语音数据对上述算法在MATLA上进行了仿真,用大量的实验结果数据画出了各个系统的DET曲线,以便于对系统的性能进行分析和比较。从实验结果可以看出,这些方法使系统的噪声鲁棒性得到了很大的提高。
其他文献
期刊
随着电子技术的飞速发展,嵌入式系统的应用己经深入到人们生活的方方面面,而种类繁多的微处理器极大地降低了嵌入式软件的通用性,造成了许多嵌入式应用的重复开发。为了使应用程序在嵌入式系统之间具有高度的可移植性,Java虚拟机技术被广泛采用。  由于Java自身的一些特征导致其存在效率低、内存占用等缺陷,因此,提高Java虚拟机性能已成为一大研究热点。目前对Java虚拟机的优化工作主要是针对桌面计算机,而
期刊
期刊
会议
注塑机械手是模仿人类上肢设计而成的一种专用机器人,主要作用是在高温、狭小环境代替人工把塑料产品从注塑机模具中取出。注塑机械手可以改善工人工作环境,提高生产效率,降低废品率,增强企业的市场占有率,所以被广泛的应用在塑料生产厂家中。而注塑机械手在使用的时候系统与用户之间需要进行频繁大量的进行人机交互,所以设计一个具有良好人机界而且性能可靠的手持设备对注塑机械手来说起着至关重要的作用。鉴于Windows
高级加密标准(Advanced Encryption Standard,AES)因其严谨、高效、安全的数学设计,成为21世纪新的高级加密算法,在计算机通信和信息系统安全领域有着广泛的应用。旁路攻击(Side Channel Attack, SCA)技术利用密码算法在软\硬件实现时泄漏的物理信息可恢复出算法的密钥,对算法实现的载体——芯片的安全构成重大威胁。本文以AES安全实现为研究对象,以SCA技
期刊
针对大多数身份验证系统的便携性不好以及对固态硬盘数据库的过分依赖的问题,本文提出了一种基于二维条码和DSP的指纹识别系统,该系统是以TMS320VC5416为核心处理器,通过条码读取设备从PDF417码证件里读取指纹信息,同现场实时采集的指纹信息进行模糊匹配,实现对持证人身份的快速验证。  本文的主要研究工作包括以下几个方面:  (1)分析指纹识别技术的发展现状,深入研究国内外现有的指纹识别系统的
期刊