基于GMM的说话人识别系统研究与实现

被引量 : 48次 | 上传用户:aifuweimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别也称声纹识别,其目的是根据说话人的声音特征来完成说话人的辨认或确认。随着网络信息化技术的迅猛发展,身份验证的数字化、隐性化、便捷化显得越来越重要,说话人识别作为一种生物认证技术,在视觉监控、身份验证、司法刑侦及金融安全等领域有着广泛应用前景,成为当前语音信号处理领域的研究热点。说话人识别技术研究的关键是语音信号的特征提取和模式匹配等问题。本文在研究当前说话人识别主要算法的基础上,通过研究基于声学特性的倒谱特征提取方法和基于模板匹配及概率统计的模式匹配方法,研究实现了基于矢量量化VQ的说话人识别系统,重点研究设计了与文本无关的基于混合高斯模型GMM的说话人识别系统。论文主要研究内容如下:(1)总结归纳说话人识别技术的发展、研究热点和难点,分析讨论了现有说话人识别主要算法。(2)分析研究了说话人识别语音预处理,重点对减谱法语音增强算法进行了改进,通过实验分析了语音增强效果,提高了噪声环境下的说话人识别系统的鲁棒性;研究了说话人识别的特征提取原理和方法,仿真实现了说话人基音特征、LPCC和MFCC参数及差分倒谱参数等的提取。(3)在分析VQ基本原理、LBG算法和VQ码本初始化的基础上,设计实现了基于VQ的说话人识别系统,完成了模型参数训练和匹配识别过程,实验分析了不同模型参数及不同语音样本时长下的系统识别性能。(4)为了提高系统识别率和稳定性,在研究GMM模型参数估计期望最大化(EM)算法、模型参数初始化、训练和识别过程的基础上,研究设计了基于GMM的说话人识别系统,并完成了系统仿真实验,分析了不同模型参数、不同特征提取方法、不同语音样本时长和不同信噪比噪声环境下的说话人识别性能。(5)分析了开集说话人识别方法、说话人确认阈值选取方法,研究了一种先辨认后确认的开集说话人识别方法,分析了针对集外冒充说话人的“拒识问题”,并完成了基于VQ和GMM两种模型的开集说话人识别系统性能分析比较。
其他文献
据统计,目前我国交通隧道渗漏水问题十分严重,隧道与城市地铁防排水工程的总体质量并不能令人满意。近年来随着隧道建设数量和长度的快速增长,城市地铁的大规模修建,对其环境
以LabVIEW为开发平台,介绍了生产者/消费者架构的设计思路和实现过程。详细介绍了以生产者/消费者为架构并结合事件响应机制创建的数据采集系统,可实现多通道数据的采集、数据的
丝氨酸/苏氨酸蛋白激酶PLK1 (Polo-like kinase 1)在启动、维持及完成哺乳动物细胞有丝分裂过程中扮演重要角色,并且越来越多的研究表明PLK1在多种恶性肿瘤中表达异常升高。本
Spielberger将焦虑分为特质焦虑和状态焦虑,特质焦虑是指在焦虑倾向上所表现出的相对持久的、稳定的个体差异,即把外界环境刺激知觉为危险的或威胁的倾向,以及对这个威胁可能
本文选取1919年至20世纪末口语性较强的现代汉语文学作品建立了现代汉语封闭语料库,选取了古代各个时期口语性较强的古代汉语文献建立了古代汉语封闭语料库,以“长”、“短”
本研究主题为“导师与研究生的关系”,从研究生的视角看师生关系。目前该领域在我国研究尚少。作者通过访谈的方法搜集资料,运用质的研究方法,在人际关系相关理论的基础上进
目的:了解合肥地区医务工作者心理健康的真实情况,并对可能的原因进行分析,探讨各种因素对心理健康的影响,为改善医务人员的心理健康提供科学依据,并提出合理化建议。方法:本
土地是人类活动的主要平台和最基本的资源。土地的可持续性利用关系着当代及后代人的生存和发展,土地利用的可持续性评价是衡量土地可持续利用程度的一种定量方法。传统的土
公用事业民营化改革成功的关键是公用事业规制的法治化。在全球民营化背景下和市场经济的发展中,我国也逐渐加入民营化的大军。公用事业民营化改革对社会经济的发展具有重要
目的:探讨重度子痫前期并发低蛋白血症对妊娠结局的影响。方法:回顾性分析了2003年1月至2009年10月在我院住院的147例重度子痫前期患者的临床资料,以血浆白蛋白30g/L为界将重