论文部分内容阅读
声纹识别是在“信息危机”的时代背景下而孕育起来的一种生物认证技术,它以其独特的便捷性、准确性、经济性深受世人瞩目,并得到了快速的发展。但由于特征参数与声纹模型的局限性,这些年声纹识别的研究进入了瓶颈期,识别率很难再得以提升。本论文以提高声纹识别率为最终目的,对声纹识别展开了深入的研究。论文先总体讲述了声纹识别系统的结构和基本原理,然后对系统的特征提取、预处理、高斯混合模型等主要部分分别展开了细致的研究。在特征提取方面,先讲述了线性预测的基本理论,并由此推导出线性预测倒谱系数;接着又从同态滤波的基本原理出发,得到了摩尔倒谱系数;最后对这两种特征参数进行了改进和优化。在模式匹配方面,先利用第二章提取出来的特征参数,由K-均值聚类算法进行了模型的初始化,接着用EM算法进行了模型的训练,最后得到了说话人的高斯混合模型。论文的最后部分对各个模块算法进行了整合,并做了相关的性能测试实验。本论文的主要创新点是:提出了一种改进端点的检测算法,新的算法更彻底的去除了背景噪音,从而获得了更为精准的有效语音段,这样经过特征提取之后,就能获得更能反映说话人个性特征的特征参数。实验表明,改进后的算法,使系统的识别率提高了2%。