论文部分内容阅读
说话人认证是一项通过计算机来对用户身份进行认证的技术,可以分为声纹认证和内容验证,本论文主要在信道鲁棒的特征提取、说话人确认和语义信息验证三个方面进行了电话信道下的说话人认证的研究,主要工作内容概括如下:1.针对电话信道下的说话人确认,作者首先研究了常用的几种信道均衡算法,实验结果表明,经过RASTA滤波器后的PLP参数再通过倒谱方差归一能够对信道卷积噪声有着很好的抑制。接着本文以此为基线系统,提出了一种基于互相关信息的特征选择算法,选择最佳的特征表示,最后通过线性判别分析对所选取的特征进行区分性变换,实验表明,经过这两个步骤后,系统的错误拒绝率下降了17.4%。2.在运用文本相关的说话人确认技术中,本文分别研究了VQ、DTW和HMM三项传统的技术,并提出了将背景矢量量化码本作为其中DTW和VQ方法的背景模型,实验表明,当使用5个训练样本时,码本归一化使得这两种方法的平均错误率分别下降了18.6%和27.0%。同时本文还采用基频、能量和时长特征与此三个系统结合,使用了多层神经网络和AdaBoost增强学习算法对得分进行分类,分类后的性能又获得了进一步的提高。3.语义信息验证技术将语音与用户预存的文本进行比对验证,以判别未知说话人是否拥有声称用户的知识。说话验证是常见的实现方案,在本文中,作者采用了多层次的置信度检验公式,在不同级别的声学层次和声学模型上对声音进行验证打分,最后系统将这些得分融入到神经网络和AdaBoost增强分类器中,和单个分类器相比,系统的平均错误率下降了23%。同时本文还将零规整和文本相关的阈值归一化方法结合,平均错误率从原先的1.39%降低到了0.58%。4.本文对说话人认证的应用方案做了分析和研究,讨论了语义内容,声纹信息和安全性的关系,最后在说话人认证的实验中将说话人确认技术和语义信息验证技术结合。当冒充者未知用户密码时,保证了仅提问一个问题时系统的虚警率为0.02%,同时目标说话人的正确接受率达到98%。