基于矢量量化的说话人识别算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:qinxueqiQQ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别(speakerrecognition,SR)是根据某个人发出的语音中的参数对其身份进行自动识别的技术。作为生物特征识别的种类之一,有着方便、自然、经济、安全无创等优点,因此得到了广泛的应用。说话人识别产品也渐渐走向实用,向着便携式、经济型方向发展。本文针对SR系统在实用时出现的问题比如:环境噪声大、识别率低、算法复杂度高等,在进行理论研究的基础上主要做了以下工作:   1.SR算法改进。(1)语音去噪方面,使用递归最小二乘(RLS)自适应滤波算法,对环境噪声中的高斯白噪声进行了有效去除;(2)语音端点检测方面,采用基于短时能量和平均过零率的检测方法,对语音段和静音段进行了有效地区分;(3)特征提取方面,研究并验证了主流的特征参数线性预测系数(LPC)和美尔倒谱系数(MFCC)的识别效果,并在两种参数的基础上进一步提取一阶差分特征,应用于说话人识别系统;(4)模式识别选用矢量量化(VQ)算法,在聚类方法上克服传统的LBG算法的缺点,采用基于模糊聚类的初始码本设计算法,提高了系统的识别率。   2.在MATLAB环境下设计并实现了说话人识别算法实验方案。(1)建立一个小型的50人语音数据库;(2)预处理阶段用RLS自适应滤波器对带噪语音去噪,用双门限法进行端点检测;(3)提取特征参数,比较不同特征参数的不同阶数对识别结果的影响;(4)优化算法参数,包括特征参数阶数以及聚类算法中码本长度等,以应用到DSP算法中;(5)利用MATLAB的GUI设计了说话人识别系统的界面。在MATLAB上的实验结果表明:算法改进后,识别率平均提高了15%;使用优化的参数,可以保证较好的识别效果。   3.将改进后的算法转换成C语言在DSP便携系统上实现。选用性能优良,但是低成本的定点DSP芯片TMS320VC5509,在开发板上对说话人识别系统做了10名实验者的声音采集和识别实验。初步识别实验表明本系统运行稳定可靠,识别效果较好,达到了预期效果。   本文的研究为便携式、经济型说话人识别产品的开发奠定了基础。
其他文献
音频识别是一门涉及面很广的交叉学科,是人机最自然,最简洁的交流方式。人们通常使用的技术有动态规整技术(DTW),隐马尔科夫模型(HMM),矢量量化(VQ),人工神经网络(ANN)等。本文研究的
当前,为满足现代航空发动机高推重比、低成本的需要,国内外在军、民用航空发动机压气机方面发展迅速,主要表现在级负荷的显著增加。常规基于经验模式的设计方法已无法满足新一代
开放式傅里叶红外光谱仪是一种新型的,绿色的,可以实现在线实时测量的,并且适合工业现场复杂多样的现场环境的检测仪器,例如:对正在行驶的的汽车进行尾气检测,还有工业生产的现场进
本文通过对荣华二采区10
期刊
卫星长期运行于环境恶劣的太空中,容易发生故障,而各种新技术新概念的提出又对卫星的安全性和可靠性提出了很高的要求,这就使得故障诊断技术得到越来越多的重视。在卫星故障
液晶面板本身并不发光,为了达到显示目的,液晶面板通常要装配上能够提供光照强度的背光源照亮显示区域。实现良好的散热是液晶显示背光源发展的主要瓶颈之一。为提前预知液晶显
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
随着航空航天事业的飞速发展,力参地面测试台由于其在对力学参数采编设备的综合测试及分析中的重要作用,已经成为了当今航天系统中重要的科研项目之一。它可以模拟力参采编单元
航天信息系统是具备侦察监视、通信中继、导航定位、气象观测和导弹预警等功能的一类天基资源体系,在各领域发挥着极其重要的作用,支持未来战争形态实现海陆空天电五维一体化
卫星编队飞行过程中的姿态协同控制是影响编队的空间任务成功与否的一个重要因素。无论是通过卫星编队来完成目标观测、定位导航制导还是对地成像等任务,都需要卫星编队中的