论文部分内容阅读
说话人识别作为生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动鉴别说话人身份的技术。说话人识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。
在说话人识别系统中,如何提高反映说话人个性的语音信号特征参数的有效性和实时性是关键问题之一。本论文以作者攻读硕士学位期间承担课题的工作为基础,提出一种基于D-S证据理论进行数据决策级融合的说话人识别方法。本文的工作主要集中在以下几个方面:
一、线性预测倒谱系数和Mel倒谱系数是最常用的说话人识别特征。本文提出了一种基于Dempster-Shafer证据理论的说话人识别方法,通过不同说话人特征的模型输出,用D-S证据理论对线性预测倒谱系数和Mel倒谱系数进行数据融合,得到基本概率赋值,并依次得出证据的置信度,从而达到识别说话人身份的目的。
二、与基于加权平均和投票表决的数据融合方法进行比较。通过实验证明有助于识别率的提高。
三、在VC++6.0平台上实现了一个不依赖文本的说话人辨识系统,对上述各种方法进行了实验对比,对实验结果进行了较为详尽的分析,验证了文中所提出的理论和方法的有效性。