基于小波分析的说话人识别鲁棒性特征参数研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:deannazhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种新兴的生物识别技术。说话人识别,就是通过对待识别的语音信号提取相应的特征,与参考特征模型进行匹配,最后判断出说话人的身份。一个完整的说话人识别系统包括语音信号的预处理、特征参数的提取、参考模型的训练、模式匹配、判决等多个功能模块。每个部分在功能上可以是独立的,但不同模块相互配合才能实现说话人识别系统整体功能。经过几十年来的研究,说话人识别技术有了较大进展,识别性能不断提高,并逐渐投入应用。说话人识别在信息安全、电子商务、安全防卫等领域都具有广泛的应用前景。   虽然在理想的实验室环境下,说话人识别的识别率已经可以达到95%以上,但是实际使用环境中无处不在的各种噪声对参考模型和待测语音信号的特征匹配产生了巨大影响,以至说话人识别系统在实际环境中识别率的急剧下降。对于存在噪声的实际应用环境,如何进一步提高说话人识别系统的性能、增强系统的抗噪声鲁棒性是目前研究的重点和难点。而特征参数是关系到整个说话人识别系统性能的关键,构造一种抗噪鲁棒性较好的特征参数对于提高系统的性能具有重要意义。   小波分析是二十世纪以来最重要的信号分析工具,被誉为信号分析的“数学显微镜”,小波分析是一种对信号进行时间-尺度分析的新方法,具有多分辨分析的特点,具有很好的在时域和频域上表征信号局部信息的能力。   本文研究的目的就是利用小波分析这一工具。通过对含噪语音信号进行多分辨率分析,在对实验数据进行评价的基础上,找出不同分解尺度下小波系数对噪声的不敏感程度,进而在此基础上构造出一种抗噪鲁棒性更好的语音信号特征参数,并建立一个基于矢量量化技术的说话人识别系统进行实验验证。   本文首先阐述论文选题的研究目的及意义,介绍了说话人识别技术的国内外发展现状和应用前景,介绍该技术的研究重点和研究难点所在,并介绍了论文的主要研究内容和具体的章节安排。本文介绍了说话人识别系统的分类,详细介绍了系统各个具体组成部分,研究了语音信号预处理、特征提取、特征匹配方法和说话人识别系统的性能评价标准;本文介绍了小波分析的理论发展,连续和离散小波变换的基础理论知识。研究了常用的小波函数,研究了小波多分辨率分析的相关原理,并选择了本文实验所要使用的最佳小波函数。   本文研究了语音信号的产生机制,并在此基础上研究了语音信号的数字模型,包括激励模型、声管模型和辐射模型三个子模型。研究了噪声的种类,研究了高斯白噪声和有色噪声的区别。   本文对含噪语音信号的小波系数进行了着重研究。利用小波多分辨率分析的方法,依据两种评价标准--均方欧氏距离和相关系数,通过对不同噪声情况下、不同噪声强度下实验数据的分析,得到了含噪语音信号在不同尺度下小波系数对噪声的不敏感程度,判断出小波系数自身具有一定的鲁棒性。在此基础上,本文还对说话人识别常用的语音特征参数进行了研究,主要研究了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种主流的语音特征参数。依据小波系数对噪声不敏感程度,构造了一种具有较好抗噪鲁棒性的基于小波系数的加权特征参数。因为各个尺度下的小波系数的能量是不同的,不同的能量值可以很好的表征语音信号的特征,而根据小波系数对噪声的不敏感程度,可以设置不同权值,加权后的小波系数能量特征在理论上应具有更好的鲁棒性。   本文为了验证基于小波系数的加权特征对于增强说话人识别系统鲁棒性能力,建立了一个基于矢量量化(VQ)方法的说话人识别系统进行仿真实验。所建立的说话人识别系统包括三个主要的功能模块:语音信号预处理、特征提取和特征匹配。在特征提取过程中,将提取待测语音信号的特征参数。一个完整的说话人识别过程可以分为训练和识别两个部分。通过模拟不同噪声环境、不同噪声强度,进行大量的说话人识别测试实验,并统计出正确识别率。论文具体进行了采用具有较好鲁棒性的MFCC特征和基于小波系数的加权特征的说话人识别对比实验,实验结果证明基于小波系数的加权特征参数能有效提高系统的识别性能,具有较好的鲁棒性。   本文研究所进行的实验均是在Matlab软件平台上实现的,并安装有小波工具箱和语音处理工具箱。实验通过添加四种不同种类的噪声来模拟不同的噪声环境,分别是高斯白噪声,三种有色环境噪声(Car、Train、Babble);通过设置四种不同的信噪比,分别是0dB、5dB、10dB、20dB,模拟不同的噪声环境强度。   通过对实验数据的对比分析,无论是对于哪种噪声环境,在不同的噪声强度下,基于小波系数的加权特征都能够提高系统的正确识别率。具体来说,在较强的高斯白噪声环境下,基于小波系数的加权特征参数具有一定的抗噪鲁棒性,识别率的提高达到了3%-5%;而在较强有色噪声环境下,基于小波系数的加权特征参数具有较好的抗噪鲁棒性,识别率的提高超过了15%。
其他文献
覆盖和连通是影响无线传感器网络(Wireless Sensor Networks, WSNs)性能的两个基本因素。覆盖反映了无线传感器网络对区域或目标的监测质量,连通则决定了网络中节点之间通信
心脏疾病一直是威胁人类生命健康的主要疾病之一。心电图反映心脏兴奋的产生、传导和恢复过程中的电变化,通过心电图,心脏电活动的检测和分析已经成为医学临床实践中心脏功能检
未来的移动通信网络会是由各种不同接入技术融合在一起的异构网络,这种复杂的网络能够为用户提供各种接入方式、传输速率、多样化的服务,更好地体现出用户的需求。垂直切换相
CTP(Computer to plate)技术,即计算机脱机直接制版技术,经过计算机将数字页面直接输出到印版上[1],是印刷数字化发展的必然结果,是印前技术的一次转折,引起了国际的广泛关注,因此,
井地电位成像技术是近代发展起来的一种新型电测方法,主要应用于油田注水分布及剩余油分布的研究,通过监测地下介质非均匀性而形成的地表分布电位场,可研究地层介质电阻率分布,从
随着现代化工业的快速发展,重金属的开采、冶炼、加工等活动越来越多,大量的重金属被排放到环境引起了严重的污染。重金属铜和锌不仅是生物体的必需微量元素,也是环境污染元素。它们不经过处理直接排入自然水体后,可以通过食物链的累积会对人体健康和生态环境产生严重影响。因此这两种金属常常被当作模式金属进行研究。碳纳米颗粒(CNPs)是近年来出现的一种新型的碳纳米材料,其表面富含羟基和羧基,具有良好的亲水性。本研
人脸识别是近年来计算机视觉和模式识别的研究热点,它在身份认证、视觉监控、娱乐动画以及多媒体领域的应用日趋广泛。人脸识别主要包含人脸特征提取和分类,本课题重点对人脸特
本文将机器视觉和图像处理技术融入到紧密对接焊缝检测系统中,提出同时采用LED光源和激光进行紧密对接焊缝检测,来解决紧密对接焊缝检测难问题,本文主要研究内容包括以下几个方
网管平台上呈现的告警信息及时向网管人员报告了网络及网络中设备的异常状态,然而接入层客户端设备量大,故障告警信息规模与频度相应很大,使得引发设备告警的故障原因判断更
随着我国经济的快速发展,高层建筑逐渐增多,建设高层建筑所需的施工升降机的数量急剧增长。与此同时施工升降机事故也频频发生,造成群死群伤的严重后果。升降机超员是引发此类事