基于高斯混合模型的说话人识别技术研究

来源 :南京邮电学院 南京邮电大学 | 被引量 : 0次 | 上传用户:jzg8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  近年来,随着移动通信、网络和语音处理技术的快速发展,说话人识别技术的应用越来越广泛。本论文研究了基于高斯混合模型(GMM)的说话人识别系统,从说话人识别系统的各个组成部分分析了可以改善系统性能的可能途经,其中着重研究了白噪声环境下的说话人识别问题。本论文的主要工作有:   在说话人识别系统的语音特征参数提取部分,介绍了LPC倒谱和Mel倒谱等参数,分析了对干净语音和加白噪声语音的Mel倒谱各阶系数加权后对系统性能的影响。得出结论:高阶Mel倒谱系数抗噪性较差而低阶倒谱系数抗噪性较好。因此可以根据抗噪性的强弱对该倒谱各阶系数进行合理加权,以便突出抗噪性强的系数对识别的贡献。   提出了一种高斯混合模型距离测度的方法。基于此方法提出一种改进的说话人辨认系统:在几种参数中选择使说话人辨认系统模型平均距离较大的特征参数进行识别。研究了影响说话人识别系统性能的三个因素:GMM的参数、测试语速、测试语音长短,并且利用基音频率对说话人进行预分类来改善识别系统性能。   在加性白噪声环境下研究了Mel倒谱参数、Mel差分倒谱参数的顽健性以及他们经过倒谱系数零均值化处理后系统性能的改进。得出结论:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的去除加性白噪声对系统性能的影响。   研究了说话人辨认系统中模型自适应技术。得出结论:采用一年前的模板,当进行自适应后识别率提高很多。虽然自适应后仍然比重新训练模板识别率稍低,但从实验中可以明显感到,自适应比重新训练模板节省很多时间,这对于说话人的实时识别是有益的。
其他文献
  本文对光子晶体光纤的理论进行了系统、深入的研究,并对光子晶体光纤的制造工艺和关键技术进行了研究,提出并建立分析光子晶体光纤的全矢量超格子模型,;首次提出了三角格子光
本文主要研究了异构无线网络中的接入网选择策略和切换触发时间选择策略。首先,指出了多网融合是下一代无线通信系统发展的必然趋势,进而引出了异构无线网络中的切换管理相关概
近年来,数字信号处理技术与分子生物学的结合产生了生物信息学的一个新研究领域。为了处理和分析海量的生物分子数据,数字信号处理技术,尤其是数字滤波器,无疑是一个非常合适的选
冠状动脉搭桥术目前已成为治疗冠心病的重要方法,术后可改善患者的生活质量。通过术后严密的监护及高质量的护理,可预防和减少并发症,降低死亡率,提高手术效果[1]。我院自近2到3
期刊
水声信道中广泛存在的多径传播效应是水声通信所面临的主要障碍之一,由多径所产生的信号衰落效应是影响水声通信系统性能的主要因素之一。自适应波束形成、自适应均衡、分集、阵列处理等技术都是解决多径干扰常用的技术。扩频技术特别是直接扩频技术也是对抗多径干扰的一种非常有效的技术,其中的RAKE接收技术不但能够抑制干扰;而且还能利用多径干扰的能量提高信噪比,极大的改善了系统的性能,并且扩频技术是现在唯一能工作在
期刊
射频接收机前端系统是无线接收机非常重要的组成部分,在无线通信中发挥着特殊作用,其性能的好坏直接决定了整个系统的噪声系数、灵敏度、线性动态范围等重要指标。因此,对射频接
多媒体数字水印技术是信息隐藏技术研究的热点之一,是目前信息安全领域内的一个前沿课题。本文在详细分析了信息隐藏技术的特点和需求的基础上,从信息隐藏技术的应用角度出发
期刊