论文部分内容阅读
语音信号处理技术是信息社会不可或缺的技术,说话人识别是语音处理的一个重要研究领域。说话人识别又称声纹识别,是利用说话人的语音特征对说话人的身份进行辨认或确认。它综合了多门学科的理论成果,如声学、语音学、语言学、生理学、数字信号处理、模式识别、人工智能等。说话人识别在司法查证、机要保密、电子商务等领域有着广泛的应用前景。
说话人识别系统主要是由特征提取和模式分类两部分组成。特征提取,即如何从数据量相当大的原始语音信号中提取出反映说话人个性特征的参数;模式分类,即设计出行之有效的分类器。本课题特征提取采用了美尔倒谱系数(MFCC)与一阶差分美尔频率倒谱系数(△MFCC)相结合的新特征参数,模式分类采用了传统的,具有良好识别性能的矢量量化模型。最后用MATLAB设计了与文本有关的闭集的说话人辨识系统平台,在包含20个人的语音数据库上做了测试,得出在纯净语音环境下,有很高的识别率。
说话人识别虽然研究历史较长,但仍有许多问题有待研究解决,噪声环境下的说话人识别即是其一。在纯净语音环境下系统有很高的识别率,但在噪声环境中识别率显著降低。实验也显示出此结果,且信号信噪比越低,系统识别率越低。
为了使说话人识别能够真正运用于实际,而不是始终停留在实验室,需要说话人识别系统对多种不同类型的噪声和不同信噪比条件的噪声具有良好的鲁棒性。本课题考虑了高斯白噪声环境下,信噪比选用:10dB、15dB、25dB、30dB、40dB的噪声信号,用小波去噪方法对信号中噪声进行抑制,以提高说话人识别系统在噪声环境下的顽健性。实验结果显示,去噪后系统识别率有所提高。使得本课题设计的说话人识别系统具有一定的实际意义。
毫无疑问,寻找并利用行之有效的去噪方法是提高系统实用性的关键技术,也是本人今后工作的重要方向之一。
说话人识别系统主要是由特征提取和模式分类两部分组成。特征提取,即如何从数据量相当大的原始语音信号中提取出反映说话人个性特征的参数;模式分类,即设计出行之有效的分类器。本课题特征提取采用了美尔倒谱系数(MFCC)与一阶差分美尔频率倒谱系数(△MFCC)相结合的新特征参数,模式分类采用了传统的,具有良好识别性能的矢量量化模型。最后用MATLAB设计了与文本有关的闭集的说话人辨识系统平台,在包含20个人的语音数据库上做了测试,得出在纯净语音环境下,有很高的识别率。
说话人识别虽然研究历史较长,但仍有许多问题有待研究解决,噪声环境下的说话人识别即是其一。在纯净语音环境下系统有很高的识别率,但在噪声环境中识别率显著降低。实验也显示出此结果,且信号信噪比越低,系统识别率越低。
为了使说话人识别能够真正运用于实际,而不是始终停留在实验室,需要说话人识别系统对多种不同类型的噪声和不同信噪比条件的噪声具有良好的鲁棒性。本课题考虑了高斯白噪声环境下,信噪比选用:10dB、15dB、25dB、30dB、40dB的噪声信号,用小波去噪方法对信号中噪声进行抑制,以提高说话人识别系统在噪声环境下的顽健性。实验结果显示,去噪后系统识别率有所提高。使得本课题设计的说话人识别系统具有一定的实际意义。
毫无疑问,寻找并利用行之有效的去噪方法是提高系统实用性的关键技术,也是本人今后工作的重要方向之一。