基于MT MFCC和改进BP神经网络的声纹识别技术及应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:cttc_tom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近些年万物移动互联、人工智能化的推广,在保证技术规范化的前提条件下为各行各业赋能的想法越发迫切。其中,声纹识别是一项从说话者的实时语音或录音中自动寻找匹配并识别讲话者身份的技术。声纹(说话人)识别技术不断发展,已成为一种经济可靠的身份识别和验证的方法。近年来具备自主学习能力想存储功能、非线性拟合能力、联等特点的人工神经网络的提出,为声纹(说话人)识别这一复杂的非线性过程提供了新的思路和方法。本文在误差逆向传播(BP n,Propagatio Back)神经网络的基础上,进一步研究声纹(说话人)识别技术及应用。首先,本文对声纹识别技术的原理和方法两个层面进行概述,纵观该技术在各领域使用现状及实验室项目功能需求,为解决噪声环境下识别精度不高、速度缓慢等问题,针对特征参数提取以及建模方法的改进两个关键技术进行深入研究,基于美尔频率倒谱参数(Mel-Frequency Ceptral Coefficients,MFCC)的获取,提出了一种改进的多窗谱MFCC特征参数(Multitaper MFCC,MT MFCC)提取方法。其次,本文通过语音数据采集、点检测、预加重、分帧加窗、端信号增强等预处理工作消除人为因素、设备原因对语音信号质量所带来的影响。采用MT MFCC特征参数提取方法来强调语音的低频信息,以突出声纹识别特征,减小参数波动,有效解决了在声纹识别过程中采用传统特征参数提取方法时估计方差较大的问题。最后,完成总体方案设计、选取衡量性能指标的参数、构建BP神经网络声纹识别模型,提出遗传算法(Genetic Algorithms,GA)优化及增加动量因子等手段对传统BP神经网络的算法和结构进行了改进;将改进模型在不同网络结构和数据分布下进行实验分析,得出不同参数的设置对识别的结果影响很大,需通过多次实验选择合适的数值结果;将声纹识别技术应用到语音机器人“渝娇三号”平台的语音识别系统中,并对不同噪声下改进前后的声纹识别模型进行效果测试,针对不同说话人做出识别反应。
其他文献
我国房地产市场的萌芽开始于1980年,国家出台了住宅商品化的一系列相关措施,撤销了福利分房制度并对土地使用制度进行改革,住宅需求的释放刺激一大批房地产开发企业的崛起。由于房地产业和上下游产业关系紧密,发展迅猛,逐渐成为我国经济的支柱,因此房地产业的健康对国家经济发展尤为重要。但是近几年来,商品住宅价格持续高涨,对经济和社会带来许多负面影响:打乱市场秩序,挤占中低收入家庭的正常消费拉低生活水平,炒作
随着信息化的发展,信息安全已经成为全社会最热门的话题之一,如何保障信息安全成为当前社会关注的要点之一。身份认证是对通信双方进行真实身份鉴别的技术,在信息安全方面尤为重要。目前广泛应用的经典认证方案通常是基于数学难题设计的;随着人们计算能力的提高,特别是量子计算理论和实验的发展,经典的认证方案受到了很大的威胁。鉴于量子密码协议可以实现信息理论安全性且这种安全性不受攻击者计算能力的限制,人们开始利用量
股票市场在短短的三十多年的时间已经发展成为我国市场经济中重要的一部分。越来越多的投资者关注着股票市场,如何对股价涨跌和股票价格进行精准的预测,已成为各个投资者最为关心的话题。财务指标作为上市公司每个季度都要披露的报表内容之一,在企业资产评估、企业信用评价等方面都有着非常重要的地位,往往被外界用来评判公司财务状况的一个重要指标,也常常被用来分析上市公司的股价。利用人工智能、数据挖掘技术寻找出财务指标
湿法冶金过程是应用液体溶剂将矿石中的金属通过浸出、固液分离和置换等步骤提取出来的过程。浓密机是湿法冶金过程中进行固液分离作用的主要设备,使用浓密机实现固液分离的过程称之为“浓密洗涤”。在实际生产过程中,浓密机运行的环境恶劣,影响因素众多,经常出现运行不稳定的情况,易引发“压耙”和“跑浑”等故障。故障一旦发生,不仅会使生产停滞,浪费原料,造成巨大的经济财产损失,甚至可能威胁到现场工作人员的生命。而故
随着科学技术的发展,室内机器人越来越多的出现在人们的生活中。相对于机器人室外工作环境复杂多变,室内机器人在工作过程中更多的会遇到玻璃检测、低矮物体检测等需求。在室内环境下,单线激光雷达移动机器人在工作过程中会遇到以下问题:首先由于激光雷达所采集的原始数据受传感器本身或者环境因素的影响将不可避免的出现噪点,因此需要一种滤波算法为机器人提供优质的传感器数据源;其次由于激光雷达通过光学原理测距,因此当激
大量商用核蒸汽供应系统(NSSS)及压水堆核动力装置均采用U型管式蒸汽发生器(UTSG)。UTSG的一次侧包含了多根并联的U型管。国内外许多研究发现,在入口流量较低的自然循环或强迫循环低流量工况下,部分U型管会发生倒流现象。当U型管发生倒流时,传热管总体的流动阻力增大,换热能力减弱,对蒸汽发生器和反应堆系统的正常运行造成不可忽视的影响。因此,对U型管式蒸汽发生器的倒流特性开展研究有着非常重要的意义
重大基础设施建设作为一种社会性的大规模活动,将深刻影响项目辐射区域的社会发展,对于改善生态环境、促进经济发展、提高生活质量等具有重要的推进作用。近年来为实现我国经济社会的跨越式发展,重大基础设施项目建设速度不断加快,但此类项目通常具有投资数额大、建设时间长、不确定性高、管理制度不完善等特点,在带来巨大的经济、社会效益的同时也带来了不少问题,如公众参与流于形式、征地补偿不到位、破坏文化习俗、改变社会
颗粒在日常生活中随处可见,而料罐在处理日常生活和工业生产中的粒状物料方面有着广泛而重要的应用,因此充分了解料罐内的颗粒流动形态及偏析机理对控制和优化出料过程具有重要意义。因此,本论文从基础研究与工业探索两方面对颗粒流动形态解析及偏析现象预测开展了研究工作。首先,采用实验和数值模拟的方法,从颗粒尺度动力学和结构两方面研究了颗粒在楔形料罐中不同初始堆积方式对瞬态颗粒流动的影响。结果表明,对于单粒径颗粒
随着VR技术的日益成熟,越来越多的实验室开始引入VR设备,将教学项目虚拟化进程推向了一个新的高潮。然而在多人VR实验环境下,由于带上VR设备后与外界环境完全脱离,如何避免实验人员之间的碰撞成为了一个难题。如果所有实验人员都佩戴了VR设备,可以通过设备的定位来防止碰撞,但是现实情况往往复杂多变,需要一种准确、实时、视场范围广的解决方案。双目立体视觉技术根据一组二维图像获取场景的三维信息,该技术具有精
人工林在为人类提供木材、增加森林覆盖率并减缓人类对天然林依赖的同时,也带来了地力衰退、生物多样性下降、化感作用等争议诸多的生态问题。因此,如何使人工林在满足人类对木材的需求的同时发挥其应有的生态功能是当前林业生态研究的热点之一。土壤动物作为地下生态系统的主要分解者和消费者,在枯落物分解、养分循环及地力维持等方面发挥着积极作用,对于人工林的可持续发展至关重要。因此对于人工林土壤动物的研究将有助于提高