噪声条件下鲁棒说话人识别研究

来源 :南京理工大学 | 被引量 : 3次 | 上传用户:xtyygydskf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在众多生物认证技术中,说话人识别具有独特和不可替代的应用价值。实验室环境下基于高质量语音的说话人识别技术已经相对成熟,达到了很高的识别率。然而,真实环境下说话人识别仍然面临着巨大挑战,首当其冲是噪声干扰。噪声会造成信号失真,引起语音信号训练与识别特征之间不匹配,严重影响说话人识别系统性能。因此,鲁棒性研究成为非常重要的研究热点。本文工作针对噪声条件下鲁棒说话人识别进行研究和探索,归纳如下:首先,本文提出了一种基于Fisher线性判别分析的端点检测方法。语音端点检测是语音处理和说话人识别领域不可或缺的关键技术。针对传统端点检测对受到噪声污染的清音与背景噪声之间分离能力不足的问题,提出的方法将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最大类间散度和最小类内散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,该方法在清音分离能力、整体准确率方面始终优于目前具有代表性的AMR-1、G.729B、PD、SS-AE-VAD和基于MFCC相似度等方法,其错误率比AMR-1平均降低13.1%。其次,本文提出了基于i-vector局部加权线性判别分析的说话人识别方法。噪声按干扰方式可分为信道噪声和背景噪声。以往基于i-vector的说话人识别系统不能保证样本在待识别语音近邻区域内具有最佳的分离度,使得目标说话人和其近邻间的得分差异较小,导致识别准确性下降。针对该问题,本文提出的方法在计算类内和类间散度时,增加待识别语音近邻样本权重。在此基础上,通过提高待识别语音近邻区域局部类间的分辨能力,尽可能减少因信道差异而产生的识别错误。结果表明,所提方法LWLDA能够在复杂信道条件下始终保持良好的鲁棒性,与基线相比,在交叉信道条件下的识别准确率平均提高3.6%,识别错误率相对降低19.5%。再次,本文提出了嵌入鲁棒主成分分析的语音特征参数提取方法。该方法利用鲁棒主成分分析将含噪语音的频谱分解成低秩和稀疏两部分,然后把稀疏部分作为语音频谱直接输入到特征提取算法中,未做逆STFT及平滑处理。从而避免语音中说话人个性信息的破坏,有效提升说话人确认系统的性能。与基线相比,所提方法RPCA-TVS在SNR=5dB、10dB和25dB混合条件下,其EER指标降低了 4.7%,相对降低了 19.2%。最后,本文提出了基于改进非负矩阵分解的语音去噪方法。基于传统非负矩阵分解的语音去噪,在提高语音信号信噪比的同时,也会引起语音失真。针对这一问题,所提方法通过数学模型产生基音及泛音频谱,在此基础上模仿人声的共振峰结构来合成字典,从而保证语音字典纯净性。另一方面,为了克服传统噪声字典构建方法带来的噪声信息部分丢失问题,所提方法对在线分离出的噪声样本进行分帧和短时傅里叶变换,经增益调整后,以帧为单位线性组合生成噪声字典。性能评估实验引入了包括稳定及非稳定等多种类型的噪声,实验结果表明所提方法ImNMF可有效提高说话人确认系统的鲁棒性,特别是在未知和非平稳噪声条件下,其EER相比基线系统平均降低了 4.6%,相对降低了 22.6%。为了客观和科学地评价说话人识别系统的鲁棒性,本文设计和生成了包含多种不同类型噪声的语音库。语音数据库是说话人识别研究得以顺利进行的基础。然而,国内外的语音库多是面向语音识别的,专门面向说话人识别的数据库极少。针对这一问题,在已有语音库的基础上进行整理、加噪生成了包含纯净语音、信道失配语音和混有多种不同类型背景噪声的含噪语音库。从基音范围、信道失配、噪声覆盖范围、信噪比和失真度等方面对含噪语音库进行了评估,证实所生成的含噪语音库具有一定的代表性,适用于说话人识别研究及测试任务。
其他文献
猪油皮病也称猪渗出性皮炎,此病是由葡萄球菌侵入破损的皮肤引起。葡萄球菌产生的毒素吸收入体内,可损害肝脏和肾脏。渗出性皮炎在哺乳仔猪通常只致个体发病,但对后备猪群与
在长期的革命和实践中,毛泽东以马克思主义唯物史观为理论基础,在批判继承中国传统民本思想的基础上,逐步形成了独具特色的民本思想。研究毛泽东民本思想的基本内容,对于新时期建
目的分析利多卡因宫颈旁神经阻滞麻醉在人工流产术中减少患者痛苦,预防人工流产综合反应及手术并发症的效果。方法选取我院2011年6月~2014年6月收治的孕早期人工流产患者180例
地铁和高压直流输电系统对输气管道的电流干扰会加速管道的腐蚀。具有腐蚀缺陷的在役输气管道的各项参数,如管道外径、管道壁厚、工作压力等,都具有不确定性,以西气东输二线
环境色彩设计是室内装饰设计中重要构成部分 ,本文从色彩特性的作用 ,色彩设计应协调的几个方面和设计要点 ,来谈论环境色彩设计
低阻油层已成为各油田现阶段增储上产的主力储层之一。通过对葡敖油田葡萄花低阻油层的研究发现,构造和沉积特征在宏观上综合控制着该区低阻油层的形成和分布。对构造而言,低
针对复杂热力系统机理建模参数优化中存在的问题,提出了基于遗传算法的机理模型优化方法。建立热力设备的机理模型,确定优化参数,应用遗传算法进行优化,直到模型精度达到要求
中国现代美学偏重审美和艺术的功能价值,重视美育,倡导人生艺术化,具有"国民性改造"的强烈本土问题意识。这种思想并不源自对欧洲美学的接受,而是来自对传统儒学特别是儒家心
道德教育是艾滋病防治的重要举措,大众传播是道德教育的重要载体,因而在艾滋病报道中应开展道德教育。在艾滋病的宣传报道中,社会公德、职业道德、家庭美德、个人品德教育贯