论文部分内容阅读
从语音信号中有效地提取个人特征信息进行说话人身份的辨认和确认,是语音识别研究领域的一个重要研究方向。从人机交互、身份验证、信息检索等各个应用方向而言,说话人识别都具有广泛的应用前景,其研究具有越来越重要的理论意义和实用价值。
论文首先讨论了GMM模型作为说话人模型的优越之处及物理意义。重点分析了模型的训练算法-EM算法,并针对判别时帧似然概率的得分容易受到噪声干扰等缺点,对帧似然概率进行加权,加权后的说话人辨认系统受噪声影响较小,识别率有所提高。
论文针对GMM的说话人确认系统,在背景模型和阈值设置两个方面进行深入的讨论,并针对基于GMM模型的说话人确认系统缺乏目标说话人和非目标说话人之间区分性信息的描述,提出了一种基于模板相似性度量的判决方法。新的确认系统在充分利用GMM统计特性的同时,能够更好描述目标说话人与非目标说话人之间的区分性信息,提高了识别性能。
论文对基于网络环境下的说话入辨认系统进行了研究,采用拉格朗日插值法对丢包进行补偿时,能获得较高的识别率。当丢包过多时,造成了语音数据不充分,引起说话人辨认系统性能下降。针对这种情况提出了基于GMM-DM的说话人辨认算法。改进后的说话人辨认系统在小训练样本与测试数据不够充分的情况,识别率得到了提高。
最后论文介绍在Matlab环境下,用图形用户界面设计的一个简单实用的基于GMM的与文本无关的说话人识别系统。并给出了部分源程序代码。