说话人识别中改进特征提取算法的研究

被引量 : 7次 | 上传用户:hahanikan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化飞速发展的今天,一系列语音处理技术及其应用已成为信息化社会不可或缺的重要组成部分。说话人识别即声纹识别,是语音处理技术中一个重要的研究领域,它类似于指纹识别、虹膜识别等,同属于生物识别,具有无需记忆、不被遗忘、使用方便等优点。被广泛应用于司法鉴定、医学、通讯等领域,是一种最自然的身份鉴定及生物特征识别方式。说话人识别不注重语音信号中的文字符号与语义信息,注重提取出包含在语音信号中的个人特征信息,达到判断说话人是谁的目的。特征提取算法研究的主要任务是选取和研究能表现信号类别的、有效的、稳定可靠的特征矢量,但是到目前为止还没有一种简单可行的方法能够把说话人的个性特征从语音信号中完全分离出来。为了提取到能够区分不同说话人个性特征的最优特征参数,解决噪音环境下识别率低等问题,本文主要研究说话人识别中特征参数及其改进参数的提取算法。首先本文将说话人识别中梅尔频率倒谱系数、线性预测系数和两者混合的线性预测梅尔倒谱系数三种基本特征参数分别应用于已搭建好的说话人识别平台。文中说话人识别的模型是与文本无关的孤立词语音识别中常用的隐马尔科夫模型。本文将三种特征参数分别在四种不同信噪比(分别为15dB、10dB、5dB、0dB)以及无噪音的环境下进行说话人识别的研究,以此为基础,加入包含说话人个性特征的归一化短时能量参数作为其辅助参数,完成实验的结果与分析。分析实验结果发现识别率并不高,在信噪比低的情况下识别率明显降低。为了提取出不同说话人之间鲁棒性优、区分度好的特征参数,本文提出两种改进的特征提取算法:基于梅尔倒谱复合参数及相关距离Fisher比的参数提取与基于分布式离散余弦变换与相关距离Fisher比的参数提取。两种方法都以MFCC特征提取算法为基础进行优化与改进。前者增加了归一化短时能量参数和一阶差分参数,构成的特征矢量作为新的复合特征,称之为梅尔倒谱复合参数。并且针对高维特征参数,提出了一种基于相关距离Fisher准则的特征选取方法,利用该方法对提取出的参数进行加权降维。后者首先针对MFCC提取算法中的离散余弦变换进行分布式改进算法,其次采用上述验证后的相关距离Fisher准则的加权算法,减少其语义信息的样本个数,增强其参数在低信噪比下的鲁棒性。实验结果表明,上述两种改进算法均可明显提高说话人识别系统的鲁棒性与识别率,使本课题的研究在说话人识别中具有一定的实际意义。
其他文献
编者按:人口众多、资源相对紧缺是中国必须面对的现实.资料显示,中国人均资源占有量为世界平均水平的1/2,人均水资源占有量的1/4,森林覆盖率为世界水平的60%以上.20多年来,中
近几年来,随着中考的风向标终于指向名著阅读,"整本书阅读"成为当下语文教育关注的热点。整本书阅读和篇章阅读又有着本质的区别。本文试以《骆驼祥子》导读课为例,谈谈如何
随着国际直接投资对于经济增长的拉动力逐渐跃升至重要地位,对外直接投资逆向技术溢出效应是否能够带来中国经济的"有质"增长值得深思。本文利用2004—2015年中国31个省级面
铝合金材料具有较小的密度,较高的比强度,低廉的价格和良好的耐蚀性,广泛应用于航空航天,交通运输等领域中。材料内部的残余应力经常产生于材料受到非均匀塑性变形或热处理的
目的探讨胎儿心律失常的原因及对胎儿预后的影响。方法根据胎儿听诊、胎心监测对胎儿心率和心律进行检查,在检查过程中若发现胎儿持续性心律失常,则进行胎儿超声心动图检查:
产品曲面几何变形设计是汽车、飞机、轮船等产品设计的关键技术之一。深入研究产品曲面几何变形技术方法,为开发出更加符合客户审美需求的产品提供曲面设计理论、方法与工具
公共卫生需要创新,也需要每个需要医治的病人都能获取高质量的医疗产品,药品可及性的程度直接关系到人类的健康,保障药品可及性是政府义不容辞的责任。目前,我国药品可及性问题是
为了让大众真正认识到传统文化的魅力,增加传统文化吸引力,以改变传统文化的发展窘境,通过走访调查、查阅资料等方式,以新时代的舞狮文化为切入点进行研究分析,以求由小见大,
机车信号系统是指挥列车行进的关键设备,在铁路行车安全、提高运输效率、传递行车信息等方面起着不可替代的作用。但长期以来,与之相配套的监测维护手段存在无法动态监测、监测
摘要:根据IEA(2012)统计,全球在2011年的C02排放量为31600Mt,中国已经成为全球第一大CO2排放国,占全球碳排放的26.9%。目前,随着社会经济的高速发展和居民生活水平的提高,居民