论文部分内容阅读
说话人识别是根据说话人的发音特性自动识别说话人的过程,它不注重包含在语音信号中的语义内容信息,而是着眼于包含在语音信号中的个人发音特征,从语音中提取说话人的这些个人发音特征,用以识别说话人。随着计算机与语音的交互技术日趋成熟,说话人识别技术在许多领域内都发挥出了重要的作用,如安全和军事领域、通信领域,财经领域等。对说话人识别技术的研究可以结合DSP(Digital Signal Processor,数字信号处理器)来进行。当前DSP芯片已经在数字信号处理中被广泛应用,它具有灵活便携的特点并且有出色的数字化计算能力,因此,在DSP上实现说话人识别系统成为一个很重要的研究方向。
本文主要对基于DSP的说话人识别算法进行研究。论文首先结合对说话人识别系统的研究工作,对系统中的重点知识做了详细介绍和分析。从说话人语音信号的基本知识开始,逐步介绍了说话人识别系统中的预处理、特征参数提取、参数训练以及识别等工作。其中选择Mel频率倒谱参数(Mel-frequency Cepstral Coefficients,MFCC)作为说话人的特征参数,选择高斯混合模型(Gaussian Mixture Model,GMM)作为系统的参数模型。其次对GMM模型的训练和识别算法进行了优化,提出了基于DSP的在线训练和识别算法,该算法可以大幅度节省存储空间、降低计算复杂度,并有效地减少等待时间。
在理论介绍的基础上,本文建立了一个应用在线算法的仿真说话人识别系统,并对该系统中的各个模块进行了较为详细的介绍。文章最后对系统进行了测试,测试工作主要集中在对在线算法性能的验证和对一些系统参数取值的测定上。测试结果表明本文提出在线算法具有很好的性能,不仅系统识别率高,并且对存储资源的需求也较低,充分满足了在DSP上的应用需求。