论文部分内容阅读
说话人识别技术属于生物识别技术的范畴,是指从说话人的语音中提取特征,通过科学计算的方法来识别说话者。利用语音进行身份辨认以确认对象是否具合法进入保安、保密系统等是说话人识别的重要应用之一。通过语音输入密码的方式辨别说话人能弥补传统的按键输入密码方式的易被盗性,易遗忘性等缺点。另一方面,说话者本身的生理变动性以及说话习惯变动性,常造成识别系统性能的下降。本文在研究说话人识别系统中的各种特征参数和识别方法的基础上,着重研究了线性预测倒谱系数(LPCC)、能够适应说话者生理及说话习惯变动性的动态时间规整算法,即One-Pass DTW算法,并在凌阳16位单片机SPCE061A上实现基于LPCC与One-Pass DTW的说话人确认系统。本文的主要工作如下:
1.介绍了语音信号的预处理,包括预滤波、预加重、分帧与加窗和端点检测。
2.介绍了人卢产生的原理与数字模型,并研究了常用的语音特征线性预测倒谱系数(LPCC)和美尔倒谱系数(MFCC)的原理及提取方法。
3.研究了说话人识别的基本方法,着重介绍了动态时间规整算法(Dynamic Time Warping),并深入研究与分析了One-Pass DTW算法。
4.讨论了在凌阳16位单片机SPCE061A上实现了说话人识别系统的若干问题,并在该平台上实现了说话人确认系统。