论文部分内容阅读
在生物认证领域,说话人识别以其独特的优势——方便性、经济性、准确性,逐渐成为人们日常生活工作中至关重要的身份认证方式,并已被广泛地应用于电子商务、司法等安全领域,是当前的一个研究热点。说话人的特征参数是构建说话人识别系统的基础。当前,大多数研究中提取说话人特征参数均是应用短时分析方法(傅里叶变换法),但是说话人的语音信号是典型的非线性信号,采用线性信号分析方法势必会丢失一些重要的信息。针对此种情况,本论文展开了一系列的研究,主要工作与创新如下:第一:论文首先改进了现有的特征参数。采用感知加权技术,选择基于心理声学模型计算得到的信号掩蔽比插值作为权重函数,并将权重函数应用到mel倒谱分析中获得加权mel倒谱系数(WMCEP),实验中将WMCEP结合GMM识别模型进行说话人识别研究。第二:论文引入了非线性信号分析方法--希尔伯特黄变换(Hilbert-Huang Transform, HHT),其组成部分是经验模态分解法(Empirical Mode Decomposition, EMD)和希尔伯特谱分析(Hilbert Spectral Analysis, HSA)。应用EMD分解法并结合短时分析技术,处理语音信号,提出了三种特征提取算法。实验中选用了适用于分类问题的SVM识别模型并结合提出的特征参数应用到说话人识别中;同时为了比较分析SVM的识别性能,将GMM识别模型作为比较模型。第三:论文着重从理论分析的角度研究了基于EMD分解法提取特征参数的可行性和有效性。采用的分析方法是基于HSA谱和边界谱的EMD特征提取以及基于残差相位的EMD特征提取。EMD分解法的引入是一种新的尝试,本论文基于此提出的特征提取方法具有一定的理论依据和较好的实用效果,为今后的语音识别和说话人识别研究提供了一定的研究基础。