论文部分内容阅读
该文首先介绍了说话人识别的声学基础,详细论述了发音的生理机构与过程以及汉语语音的基本特征和语音信号的数学模型;详细分析和比较了语音的时域和频域特征参数,特别是线性分析倒谱LPCC和美尔倒谱MFCC.接着,论述了说话人识别系统的结构及其组成部分,包括说话人识别参数的提取,说话人识别模型动态时间规整DTW、矢量量化VQ、隐马尔可夫模型HMM、高斯混合模型GMM,以及说话人识别系统的性能评估和阈值设置等问题.最后,从说话人识别参数、模型和判决准则几个方面,分析研究了解决说话人识别系统特有的鲁棒性问题.并对说话人识别今后研究的重点和方向提出了建设性的建议.