基于MFCC二次特征提取和VQ的含噪语音说话人识别研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:hellolin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字信息和日常生活信息交流的多元化发展,个人身份认证是人们参与社会活动的重要保障,以语音作为人机交互方式的说话人识别,是生物认证发展的一个方向。说话人识别基于语音信号处理技术,提取语音特征参数,建立说话人模型,并完成身份鉴定,具有便捷性和可靠性等优点,在刑事侦查、电话银行系统、计算机远程登录、门禁系统等领域,具有广阔的应用前景,受到越来越多研究者的重视。  目前说话人识别在实验室环境下取得了令人满意的结果,但说话人识别技术在实用过程中还存在诸多问题,需要进一步的研究。本文从说话人识别系统的整体着手,分析了语音前段处理的重要性,详细地阐述了特征参数的研究现状,介绍了目前应用于说话人识别的常用模型,并对其进行分析比较。本文的主要研究内容如下:  (1)由于语音的产生不可避免地要受到环境噪声的影响,使得说话人识别系统的识别率急剧下降,严重影响说话人识别系统的鲁棒性。因此,本文着重研究在不同噪声环境下的语音增强,利用经验模态分解进行语音信号分解,对本征模态函数采用基于谱熵的语音端点检测方法进行去噪,得到的增强语音效果良好。  (2)提取信号中更具鲁棒稳健的语音特征参数,挖掘更能体现个人特色的语音参数。在说话人识别系统中,由于每个说话人固有的说话特性,由其特征参数的分布可以得到表征说话人语音特性的信息。本文基于MFCC特征参数进行研究,运用二次特征提取引入新的参数?MFCC、 WMFCC和IWMFCC,采用增减分量法分析向量贡献值,去除贡献低的分量,组成新的混合参数。  (3)分析基于VQ的说话人识别系统的主要技术,建立基于VQ的说话人识别模型,采用LBG算法设计码本,选取均方误差欧式距离作为失真测度,设置不同码本容量的实验。通过实验验证MFCC、MFCC、WMFCC和IWMFCC及其混合参数的识别效果,实验结果表明,混合特征得到了更好的识别性能。
其他文献
脉诊是我国传统医学的主要组成部分和最具特色的诊断方法,已广泛地应用到临床实践中。 随着传感器技术和计算机处理技术的发展,国内外学者在中医脉象仪方面的研制和压力脉图
颜色是自然界物质的最主要的客观属性之一。长期以来对颜色表征仅限于主观的形容词汇,更谈不上定量的测量。随着社会的发展,实时、便捷、定量的测色仪器有着越来越重要的应用
在市场上存在许多国内国外的DCS组态软件产品,这些产品一般都是使用VB、Delphi或者C++语言开发。而当前DCS组态软件要求具有网络化和开放化的特点,要求组态软件与上层软件和硬
随着人们对微观领域更深入地探索及微机电系统的迅猛发展,微装配与微操作技术得到进一步的关注及研究。微装配机器人是结合微操作技术和机器人装配理论的产物,是目前微装配与
本文源于某国防预研项目,设计并实现了浮空探测系统的稳定伺服系统控制器。 动基座条件下要实现对目标的稳定跟踪,需要一套可靠的稳定伺服系统。这类伺服系统的控制器必须实
大豆是黑龙江省绝大多数农民心中分量极重的主栽作物,是近几年农民增收的现实选择,据统计播种面积已达6000万亩,占全国的40%,产量更达全国的50%。随着人们生活水平的提高,粮食供求的
逆向工程技术已广泛应用于工业制造、计算机视觉、虚拟现实等领域。影像反求技术作为逆向工程的一种具体实现,也得到了广泛的研究和发展。曲面重构是反求工程中的关键一步,常用
移动机器人与智能环境相互结合的新型网络机器人系统是目前机器人领域的研究热点之一。构件开发技术的引入,解决了环境辅助资源的异构性、动态性和未知性,也带来了机器人如何自
很早以前,科学家们就设想发明一种不用火药且不会发生膛炸的高速炮。目前的推进装置,如火炮、火箭等,大都属于化学发射器。随着科学技术的进步,它们已不能满足人类对于发射能
在多速率网络控制系统中,控制器、传感器、执行器等节点的采样周期不是唯一的,也就是说系统具有多个采样速率。相较于单速率控制系统,采用多速率架构有利于提高系统的控制性能,可