论文部分内容阅读
说话人识别是一种新兴的生物识别技术。说话人识别,就是通过对待识别的语音信号提取相应的特征,与参考特征模型进行匹配,最后判断出说话人的身份。一个完整的说话人识别系统包括语音信号的预处理、特征参数的提取、参考模型的训练、模式匹配、判决等多个功能模块。每个部分在功能上可以是独立的,但不同模块相互配合才能实现说话人识别系统整体功能。经过几十年来的研究,说话人识别技术有了较大进展,识别性能不断提高,并逐渐投入应用。说话人识别在信息安全、电子商务、安全防卫等领域都具有广泛的应用前景。
虽然在理想的实验室环境下,说话人识别的识别率已经可以达到95%以上,但是实际使用环境中无处不在的各种噪声对参考模型和待测语音信号的特征匹配产生了巨大影响,以至说话人识别系统在实际环境中识别率的急剧下降。对于存在噪声的实际应用环境,如何进一步提高说话人识别系统的性能、增强系统的抗噪声鲁棒性是目前研究的重点和难点。而特征参数是关系到整个说话人识别系统性能的关键,构造一种抗噪鲁棒性较好的特征参数对于提高系统的性能具有重要意义。
小波分析是二十世纪以来最重要的信号分析工具,被誉为信号分析的“数学显微镜”,小波分析是一种对信号进行时间-尺度分析的新方法,具有多分辨分析的特点,具有很好的在时域和频域上表征信号局部信息的能力。
本文研究的目的就是利用小波分析这一工具。通过对含噪语音信号进行多分辨率分析,在对实验数据进行评价的基础上,找出不同分解尺度下小波系数对噪声的不敏感程度,进而在此基础上构造出一种抗噪鲁棒性更好的语音信号特征参数,并建立一个基于矢量量化技术的说话人识别系统进行实验验证。
本文首先阐述论文选题的研究目的及意义,介绍了说话人识别技术的国内外发展现状和应用前景,介绍该技术的研究重点和研究难点所在,并介绍了论文的主要研究内容和具体的章节安排。本文介绍了说话人识别系统的分类,详细介绍了系统各个具体组成部分,研究了语音信号预处理、特征提取、特征匹配方法和说话人识别系统的性能评价标准;本文介绍了小波分析的理论发展,连续和离散小波变换的基础理论知识。研究了常用的小波函数,研究了小波多分辨率分析的相关原理,并选择了本文实验所要使用的最佳小波函数。
本文研究了语音信号的产生机制,并在此基础上研究了语音信号的数字模型,包括激励模型、声管模型和辐射模型三个子模型。研究了噪声的种类,研究了高斯白噪声和有色噪声的区别。
本文对含噪语音信号的小波系数进行了着重研究。利用小波多分辨率分析的方法,依据两种评价标准--均方欧氏距离和相关系数,通过对不同噪声情况下、不同噪声强度下实验数据的分析,得到了含噪语音信号在不同尺度下小波系数对噪声的不敏感程度,判断出小波系数自身具有一定的鲁棒性。在此基础上,本文还对说话人识别常用的语音特征参数进行了研究,主要研究了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种主流的语音特征参数。依据小波系数对噪声不敏感程度,构造了一种具有较好抗噪鲁棒性的基于小波系数的加权特征参数。因为各个尺度下的小波系数的能量是不同的,不同的能量值可以很好的表征语音信号的特征,而根据小波系数对噪声的不敏感程度,可以设置不同权值,加权后的小波系数能量特征在理论上应具有更好的鲁棒性。
本文为了验证基于小波系数的加权特征对于增强说话人识别系统鲁棒性能力,建立了一个基于矢量量化(VQ)方法的说话人识别系统进行仿真实验。所建立的说话人识别系统包括三个主要的功能模块:语音信号预处理、特征提取和特征匹配。在特征提取过程中,将提取待测语音信号的特征参数。一个完整的说话人识别过程可以分为训练和识别两个部分。通过模拟不同噪声环境、不同噪声强度,进行大量的说话人识别测试实验,并统计出正确识别率。论文具体进行了采用具有较好鲁棒性的MFCC特征和基于小波系数的加权特征的说话人识别对比实验,实验结果证明基于小波系数的加权特征参数能有效提高系统的识别性能,具有较好的鲁棒性。
本文研究所进行的实验均是在Matlab软件平台上实现的,并安装有小波工具箱和语音处理工具箱。实验通过添加四种不同种类的噪声来模拟不同的噪声环境,分别是高斯白噪声,三种有色环境噪声(Car、Train、Babble);通过设置四种不同的信噪比,分别是0dB、5dB、10dB、20dB,模拟不同的噪声环境强度。
通过对实验数据的对比分析,无论是对于哪种噪声环境,在不同的噪声强度下,基于小波系数的加权特征都能够提高系统的正确识别率。具体来说,在较强的高斯白噪声环境下,基于小波系数的加权特征参数具有一定的抗噪鲁棒性,识别率的提高达到了3%-5%;而在较强有色噪声环境下,基于小波系数的加权特征参数具有较好的抗噪鲁棒性,识别率的提高超过了15%。