论文部分内容阅读
语音信号处理技术是信息社会不可缺少的技术,声纹识别是语音信号处理的一个重要研究领域。随着信息技术、网络通信和电子交易的迅猛发展,信息安全已成为全球最为热门的研究领域之一。传统的以密码方式进行身份认证的技术日益暴露出很多弊端。为确保信息安全,用人特有的生物特征作为认证手段的技术逐渐发展起来,并形成了新的研究热点。声纹是每个人特有的特征,由于其唯一性,不可替代性,可以作为鉴别身份的一种重要手段,声纹认证技术也逐渐发展成生物鉴别领域的重要分支。声纹认证技术可用在电子商务、身份稽查、司法、公安、加密口令、家用电器等很多领域。
声纹认证即说话人认证是根据获取声音波形中反映说话人生理、心理和行为特征的特征参数来自动认证说话人身份的技术。声纹认证不是认证语音信号的文字内容,而是认证发出语音信号的说话人的身份。声纹认证技术是交叉运用了心理学、生理学、数字信号处理、人工智能、模式识别等知识的综合性研究课题。对现有说话人识别系统存在问题的分析,主要是因为以前往往采用线性的方法,如频谱分析来分析语音信号,而这些线性方法只适用于平稳的、一致的、平衡的线性的时间序列,对于非平稳的、不一致的、非平衡的非线性的语音时间序列,这些传统的线性方法就往往丢掉了许多蕴涵本质的重要信息。小波分析是近年来出现的新的时频局部化分析方法,具有其它方法无可比拟的诸多优点,能够更精细地描述语音信号,捕获其中重要的非平稳信息。基于上述情况,本文主要对小波分析理论在声纹特征提取中的应用进行研究。首先是在总结前人工作的基础上,详细介绍了声纹认证的基础知识和基本原理,并对基于短时傅立叶分析的MFCC参数进行分析。.然后针对短时傅立叶分析在提取说话人特征参数时的缺陷,采用了小波分析,并对小波分析理论和声纹识别技术进行研究,借鉴了这种基于听觉机理的特征参数MFCC,利用小波多分辨分析和小波包变换,构造出了一种基于小波包变换的说话人识别特征参数WPTCC。
根据实验的要求,本文在普通办公室环境下录制了一个40人的语音库。并通过在Matlab平台上构建了说话人识别系统(包括文本有关和文本无关),利用矢量量化算法对提取参数进行识别,验证了WPTCC参数有效性,实验数据表明识别率均高于MFCC参数。理论和实验证明,利用小波变换进行提取的声纹识别特征参数相比于传统的短时分析方法确实具有更好的识别特性。本文的实验也存在着一些不足,该系统对运算速度要求较高,训练模型的建立时间相对较长。还有待于今后进一步完善。