基于MFCC特征和GMM模型的说话人识别系统研究

被引量 : 29次 | 上传用户：chuanqi111

【摘要】

：

说话人识别是通过采集说话人的声音信号进行特征提取,分析处理后来进行说话人的辨认或者确认。随着当今互联网和信息化技术的飞速发展,越来越多的相关领域将用到说话人识别技

【作者】

：

周春晖

【发表日期】

：

2013年01期

【关键词】

：

说话人识别特征提取 MFCC 矢量量化高斯混合模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别是通过采集说话人的声音信号进行特征提取,分析处理后来进行说话人的辨认或者确认。随着当今互联网和信息化技术的飞速发展,越来越多的相关领域将用到说话人识别技术,说话人识别技术符合现代身份信息验证要求的数字化、快捷化、隐行化的特点。说话人识别作为生物认证技术中的一项重要技术,可以广泛应用在司法刑侦、金融安全、视觉监控及身份验证等领域。随着说话人识别研究的深入,其关键性技术主要围绕着特征提取和模式匹配等问题展开。以梅尔倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)为代表的倒谱特征参数由于充分考虑人的听觉特性,不含任何前提假设,具有良好的性能,成为语音识别领域的主流参数。而以高斯混合模型(Gaussian Mixture Model, GMM)为代表的概率统计模型由于可以有效的描述语音特征参数数据集分布,成为文本无关说话人识别领域的主流技术。本文在研究说话人识别关键性算法的基础上,通过研究基于倒谱特征的特征参数提取方法和基于模板匹配及概率统计的模式匹配方法,研究实现了基于MFCC特征的VQ说话人识别系统和GMM模型的说话人识别系统。主要研究内容如下：1.在谱减法语音增强说话人识别方法的基础上,提出一种改进的谱减法,然后直接通过增强后的语音功率谱提取MFCC参数。改进的谱减法通过改变噪声功率谱估计的统计平均参数,来消除普通谱减法对语音增强时产生的音乐噪声,提升系统的性能。最后通过实验指出了语音增强方法在低信噪比情况下,对语音效果的改善尤其明显。2.提取MFCC特征参数的一阶差分特征参数,并与原参数进行组合,得到组合特征参数。该组合特征参数相比于普通特征参数具有更高的动态特性,更好的鲁棒特性。本文首次对组合参数中具有代表性的矢量进行加权,增加说话人之间的区分程度,从而提升说话人的识别效率。3.在研究了VQ基础原理、LBG应用算法与VQ码本的根本上,设计实现了基于VQ的说话人识别系统,进行了相关模型参数训练和匹配识别过程,实验分析了不同模型参数及不同语音样本时长下的系统识别性能。最后通过该系统在第三章验证了改进的混合加权的组合特征在矢量量化系统中能够有效提升系统的性能。4.在研究GMM模型参数估计期望最大化(EM)算法、模型参数初始化、训练和识别过程的基础上,设计实现了基于GMM的说话人识别系统,进行了相关模型参数训练和匹配识别过程,实验分析了不同测试时长、模型参数、GMM混合度、噪声环境对说话人识别系统性能的影响。最后在第三章验证了改进的谱减法增强语音特征参数在噪声环境下对系统的作用。

其他文献

为鄂尔多斯绿色转型保驾护航——《鄂尔多斯市环境保护条例》出台纪实

《鄂尔多斯市环境保护条例》,2016年11月4日经鄂尔多斯市第三届人民代表大会常务委员会第二十九次会议通过,2016年12月1日经自治区第十二届人民代表大会常务委员会第二十八次

期刊

保护条例人大常委会鄂尔多斯市《鄂尔多斯市环境保护条例》绿色转型

司法过程中的法理学——以法官法理学为视角

法理学是法律背后的＂法律＂,每一部法律的成型都以成熟的法理学研究为前提,而司法实践作为法律的适用过程及结果检验,更需要法理学发挥相应的作用。法官法理学的形成与应用不仅

期刊

法官法理学司法实践能动司法技艺理性

4例肌注硫酸镁致局部脓肿的教训

<正> 例1:26岁,住院号116708。1986年6月23日因诊断妊娠足月,孕2产0妊娠中毒症收入院,住院后给25％硫酸镁20毫升肌注4次,26日又注射1次,29日发现左臀部注射处红肿、硬结、热痛

期刊

硫酸镁会阴冲洗妊娠中毒症

业财融合背景下的我国高校会计教育师资建设

信息化时代的业财融合对会计理论与实践、会计学科与行业、会计教育模式提出了挑战,也对高校会计教师提出了更高的要求。为了提升教育质量,培养符合社会需要的人才,高校教师

期刊

业财融合会计教育师资建设

铝合金的搅拌摩擦焊接研究

传统的熔焊方法在焊接铝合金时易出现气孔、热裂纹等焊接缺陷,而铝钢两种金属由于热物理性质上存在的差异,且接头易出现硬脆的金属间化合物等,增加了二者焊接的难度。搅拌摩

学位

搅拌摩擦焊铝合金铝钢异种金属连接数值模拟

城市10kV配电网规划原则和电网结构

本文对城市电网规划中的电压等级、供电可靠性、接线方式、变压器负荷率取值的影响和供电设施的原则进行了阐述。针对lOkV配电网络具体说明了规划设计的技术原则。

期刊

配电网规划电压等级城市电网规划电网结构变压器负荷率供电可靠性变电站消弧线圈备用电缆

胚胎干细胞自我更新和分化研究

论文中包含两部分的工作。第一部分工作：miR23a～27a～24在胚胎干细胞分化中的功能研究了解胚胎干细胞(Embryonic stem cell, ESC)维持自我更新及多向分化潜能的具体机制,对于人们

学位

胚胎干细胞microRNA自我更新分化单倍体胚胎干细胞纯合突变体文库

医用钛合金表面连通多孔层的阳极氧化制备及性能研究

在生物医用材料领域,纯钛及钛合金被普遍认为是最具有前途的候选材料。其中,纯钛具有优异的生物相容性和耐腐蚀性,但这种金属的强度及耐磨性相比不锈钢等医用合金较差。近等

学位

NiTi合金阳极氧化纳米多孔氧化钛耐腐蚀性

高温处理对激光熔覆自润滑耐磨复合涂层影响的研究

钛合金具有优异的耐腐蚀性能、韧性、比强度以及生物相容性而被广泛地运用于化工、航空以及生物领域。然而,钛合金的表面硬度较低、耐磨性能较差等特点限制了其在许多工业领

学位

Ti6Al4V合金自润滑耐磨复合涂层激光熔覆高温稳定性显微组织摩擦学性能

化合物G对肿瘤EGFR酪氨酸激酶家族PTK活性抑制的选择性

目的研究新四环二萜类化合物G对EGFR和ErbB2酪氨酸激酶（PTK）活性抑制的选择性和抑制程度。方法采用改良MTT法检测化合物G对高表达EGFR的人皮肤基底癌细胞株A431、高表达ErbB-2（

会议

四环二萜类化合物EGFRErbB2PTKWestern Blotting免疫组化技术

基于MFCC特征和GMM模型的说话人识别系统研究

其他学术论文