论文部分内容阅读
随着社会的不断进步和文明的不断发展,要求对特定说话人的身份进行鉴定的要求也越来越高。在所有的认证技术中,生物特征认证技术因其基于人类自身的生理和行为等特性的独特优势而得到广泛的应用,显示出生物特征认证技术在实际应用中的广阔前景。在已有的生物特征认证技术中,与文本无关的说话人确认被认为是最自然的生物特征认证技术之一,它是通过特定说话人的语音进行说话人身份认证的,也是语音识别研究中非常重要的一个研究方向。绝大多数的与文本无关的说话人确认系统都是基于短时倒谱参数和GMM-UBM-MAP模型结构的,采用这种结构的与文本无关的说话人确认系统已经达到了很高的识别率。系统的识别性能和运算量是选择说话人确认系统的两个最重要的标准。在传统的训练UBM过程中,对于每一个输入特征矢量,需要计算UBM中所有高斯分量的似然分,由于UBM采用高阶的高斯混合模型,并且是由大量的不同冒认者语音训练得到,所以训练UBM的运算量相当大,这在一定程度上限制了基于GMM-UBM-MAP结构的说话人确认系统的应用。针对与文本无关的说话人确认问题,本文深入研究了减少训练UBM的运算量,提高训练UBM的速度的方法。主要研究内容如下:1.详细介绍了基于GMM-UBM-MAP结构的与文本无关的说话人确认系统,讨论了GMM的训练算法和MAP算法。2.介绍了具有良好区分性的SVM模型,深入讨论了SVM应用于说话人确认系统中面临的问题,并比较了GMM-UBM-MAP结构和GMM-Sup-SVM结构的与文本无关的说话人确认系统的性能。3.介绍了两种基于短时分析的声道倒谱参数MFCC、LPCC的提取方法,并且讨论了它们在说话人确认中的有效性和鲁棒性。4.深入分析了训练UBM模型过程中运算量大的问题,介绍一种基于排序高斯混合模型的训练UBM的方法,该方法可以降低训练UBM的运算量,提高训练UBM的速度,它将UBM中各个混合度按照预定的准则进行顺序排列,输入的训练语音帧只需要参与到所有混合度中的部分高斯分量的训练中,从而降低训练UBM的运算量。采用排序高斯混合模型方法训练UBM后,不仅降低训练UBM的运算量,而且几乎不影响系统的识别性能。