论文部分内容阅读
随着信息技术的发展,人们的交互手段越来越多样化,对身份鉴别的要求随之越来越高。生物认证技术基于人们自身的生理和行为特征进行身份鉴别,以其独特的优势,日益显示出它的价值。说话人识别技术被认为是最自然的生物认证技术,它是一项根据语音中反映的说话人生理和行为特征的语音参数,自动识别说话人身份的技术。近年来,说话人识别技术已成为研究领域的一大热点。然而,说话人识别技术应用于实际环境,还存在着很多难点,实时性不够就是其中之一。在详细分析说话人识别的最新的研究进展和主要特点的基础上,本文试图用多元统计分析中的两种方法:主成分分析和线性判别分析解决这个问题。 本文的第一个工作是研究了主成分分析(PCA)的最优降维性质在说话人识别中的应用。在说话人识别系统中,通常训练说话人模型需要很长的时间,特别当说话人特征的维数很高时。主成分分析是一种在均方误差前提下最优的线性降维方法,通过将原始特征向量向更小的子空间上投影,主成分分析达到了降维和去冗余的目的。因此,经过降维,损失的特征信息最少,在保证识别性能的同时,后续阶段的计算开销将会大大减少。据此,本文将主成分分析方法应用到说话人识别中,并提出了两种新的基于PCA特征变换的说话人鉴别系统。实验结果显示,主成分分析在说话人特征的降维和降噪方面都取得了不错的效果。 本文的第二个工作是研究了线性判别分析(LDA)的区分性变换在说话人识别中的应用。线性判别分析在形式上同主成分分析很相似,但两者在原理上有本质的差别。主成分分析关注的是寻找能最高效表达原数据信息的方向,而线性判别分析的重心则在寻找最能区分不同类数据的方向。线性判别分析方法使得类间距离与类内距离的比值最大,所以,经过线性判别分析变换,所获得的新的数据将达到最大的区分性。本文将线性判别分析方法应用到说话人识别中,以获得更具区分性的说话人特征,并提出了一种新的基于LDA特征变换的说话人鉴别系统。该系统同样在无噪语音和有噪语音的情况下,都取得了很好的效果;在某些情况下,识别性能还优于基于PCA变换的系统。 本文的第三个工作是研究了主成分分析方法的分类性质。现有的说话人分类方法,它们或者虽然取得了较好的识别率,但计算复杂度很高;或者虽然计算速度较快,但在说话人人数增多时,识别率会急剧下降。根据主成分分析的定义,它本质上具有分类的能力。在本文中,我们研究了主成分分析方法的分类依据,并提出了一种基于主成分子空间的新的PCA分类器。我们将其同另一种PCA分类器进行决策融合,获得混合PCA分类器,以加强分类能力。我们将这三种分类器应用到说话人识别中,并取得了令人鼓舞的效果;复杂度分析验证了PCA分类器在时间复杂度和空间复杂度方面的优势。