论文部分内容阅读
说话人识别又称为声纹识别,是指根据说话人的声音特征来识别说话人的技术,近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到瞩目,在信息安全领域的应用逐渐增大,并将日益成为人们日常生活和工作中重要且普及的安全验证方式。 本文回顾了说话人识别技术发展的历史,阐述了特征提取、模式匹配和判决规则等说话人识别中的主要技术理论。详细地讨论了基音频率、线性预测系数及美尔倒谱系数等特征提取方法,以及动态时间规整、矢量量化、隐马尔可夫模型等模式匹配算法的原理及实现流程。 本文的目标是要设计一个基于DSP的说话人识别系统,性能和复杂度是比较关键的因素。因此在对几种不同的算法方案进行分析比较的基础上,采用美尔倒谱系数作为特征参数,以矢量量化作为匹配算法设计了一个说话人识别系统,并对系统在不同参数下的识别性能进行了仿真,选取最优的方案在TMS320 C5402DSK上实现了该系统。论文的主要研究方向是针对系统的实现平台上的实际应用进行系统设计、提高系统的识别率、可靠性和减少识别时间。经过测试,系统运行正确,达到预期目标。