论文部分内容阅读
说话人识别指的是根据说话人所发语音,确定出说话人是谁的过程,也就是基于声音这种生物特征作为身份认证依据的识别技术。为此,需要从各个说话人的发音中找出说话人之间的个性差异,它涉及到说话人发音器官上的个性差异、发音声道之间的个性差异、发音习惯之间的个性差异等。本文设计的系统是文本相关的说话人辨认系统。为了较好地提取语音特征参数,首先要获得去噪后的干净语音信号,在本文中采用的是小波去噪的方法去除语音信号中的环境噪声。为了得到有效的语音段,本文采用能频值来检测语音信号的端点。并且为了体现能频值端点检测算法的优越性,本文对比了传统的双门限端点检测算法和能频值端点检测算法对同一语音端点检测的效果。实验结果发现,能频值端点检测算法能够更好的检测到语音起始点和终止点,只需要调节一个相对阈值就能很好地确定语音端点,优点非常明显。本文采用线性预测倒谱系数、美尔倒谱系数和基音周期并通过对它们进行加权、微分、组合和过滤操作获得三维特征参数的策略,进一步挖掘语音特征参数背后的隐性特征,并对比了传统特征参数的单维提取与三维提取的实验结果。实验结果表明三维参数提取有效的提高了系统的识别性能。识别算法采用隐马尔可夫模型来匹配模板。实验结果表明,本系统识别率高,语音段长度短,容易采集,计算速度快。在安全级别要求较高的场合采用文本相关说话人识别系统,不仅能识别口令或密码,而且保证了系统的安全性能。