论文部分内容阅读
说话人确认凭借简便的设备与非接触式交互成为目前广泛应用的生物信息认证技术之一,也是语音识别领域的一个非常重要的研究方向,所以,它的研究不仅具有重大的理论意义而且还有非常强的应用价值。
概率统计模型是说话人确认的主流建模技术,基于该模型的说话人确认系统取得了不错的性能,然而,这种模型并不能精确地描述说话人确认这类二元分类问题的边界。近年来,支持向量机以其强大的区分性描述能力,使得它比概率统计模型更好地解决了这类二元分类问题,因而被大量应用到说话人确认上。本文以支持向量机结合其他说话人确认技术作为主要研究内容,并将其用于与文本无关的说话人确认。利用因子分析和Ivector构建了联合说话人确认系统,对联合系统的区分性说话人模型的训练矢量及测试矢量的选取、信道失配补偿策略以及参数的选择等关键问题作了详细的研究,并对它们的性能进行了比较。
首先,针对GMM-UBM-SVM系统在复杂语音环境下不能对语音进行失配信道补偿的问题,我们运用因子分析技术对语音特征进行连续失配信道补偿,使其更凸显说话人信息,并将其与SVM相结合,构建了FA-SVM说话人确认系统,并研究了失配信息子空间的大小对系统性能的影响,最后通过实验验证了经过失配信道补偿后的区分性说话人确认系统性能确实有了提高。
接着,针对FA-SVM系统存在的说话人信息损失的问题,本文研究了Ivector特征矢量,并将Ivector特征矢量与SVM相结合,构建了Ivector-SVM说话人确认系统,详细讨论了系统核函数的选取、系统失配信道补偿方法以及全变量信息子空间大小对系统性能的影响,并通过实验证明Ivector-SVM区分性说话人确认系统性能比FA-SVM系统又有了提高。
最后,针对Ivector-SVM说话人确认系统计算复杂度过高的问题,本文提出了一种基于选择通用背景模型的快速Ivector-SVM说话人确认系统,利用TopN选择策略,在基本保持确认性能的基础上有效地减少了计算复杂度,提高了系统的实用性。