论文部分内容阅读
说话人识别技术是一种的重要生物认证手段,也是身份鉴别学术会议中的一项重要内容。说话人识别的目的是通过话语找出或核实说话人的身份,可以被用于访问控制。它属于语音信号领域的一个模式识别问题。
本文设计的系统是基于VC++6.0语言实现的。VC++6.0语言用于实现语音样本采集、预处理、特征提取、分类决策等说话人识别所需的各种算法。系统中使用交叠分帧的方法短时化语音信号,使用每帧信号的能频值区分语音信号和噪声信号。特征提取方面,本文使用线性预测倒谱系数和基音频率来表征生成语音的发音器官的差异(先天的),用差分线性预测倒谱系数和差分基音频率表征发音器官发音时动作的差异(后天的)。四种特征加权扩维得到的组合特征矢量最终表征了一个特定的说话人。分类决策方面,本文使用矢量量化的方法完成对说话人语音信号的分类和判决。另外,在实现系统的基础上,分析了组合特征中各分量对说话人识别的贡献大小。同时,从基音频率构造、元音共振峰分析、能量分析三个方面对语音信号进行详细的实验分析,并通过和不带情感的中性语音信号比较,找出了不同情感信号特征的分布规律,最后提出了一种基于LPCC的情感补偿模型。