论文部分内容阅读
现在信息技术日新月异,如何鉴定个人身份来保护信息安全越来越重要。说话人识别作为生物特征认证技术的一种,是指通过说话人的语音来自动识别说话人的身份,和传统的认证方式相比,具有使用方便、安全性高、不易被遗忘等优点,在电话金融交易、军事侦察和信息检索等领域有着广泛的应用前景。 本文以校国防预研基金《智能化的实时语音识别系统研究》为背景依托,对说话人识别方法应用作了较深入系统的研究。由于说话人识别和泛布尔代数都是寻找事物特有规律、寻求一个符合人们理解的和有效的逻辑抽象,所以将泛布尔代数的思想引入说话人识别系统之中,实验证明是可行的。 本系统首先从语音信号的预处理开始分析,通过MATLAB语音处理工具箱提取输入语音的特征参数,对语音信号进行了端点检测,滤除了语音信号的无声段和噪声,为语音特征参数的提取提供了有效语音段。选用美尔倒谱系数及其差分作为语音识别的特征参数,来描述人耳的听觉频率非线性特性,提高了系统的识别性能。通过分析说话人识别基本原理与系统结构,考察现有的说话人识别技术,分别应用矢量量化(VQ)、隐马尔可夫模型(HMM)以及高斯混合模型(GMM)和泛布尔代数相结合的方法应用于说话人识别的识别方法并建立说话人识别系统。VQ方法是最简单又易于实现,HMM方法能将语音动态分割,既能体现语音的动态特征,又能体现语音的平稳特性,GMM用多个加权高斯密度函数的组合来逼近说话人特征矢量在特征空间的分布密度,收到了较好的结果。分别基于VQ、HMM、GMM方法的说话人识别系统各有优缺点,但如果用单一的说话人识别方法有一定的缺陷,如果把他们混合使用又没有单一的方法更能体现出其特点,故将泛布尔代数的思想应用到说话人识别系统之中,分别采用三种不同的说话人识别方法后再用泛布尔代数进行识别,获得了很高的识别率。 文章的最后对自己所做的工作进行了总结,并指出了存在的问题和下一步继续研究的思路。