噪声环境下的语音关键词识别技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zhangwz2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们生活方式越来越现代化,我们的生活中出现了越来越多的科技感产品,包括语音控制智能产品,相较于传统的触摸式控制它彻底解放了人们的双手。但是目前大多数基于语音命令词识别的研究都把场景局限在安静的环境中,这忽视了现实生活场景中各种各样的环境噪声,因此现有的优秀算法难以在噪声环境下仍然保持良好的性能。同时,语音命令词识别模型一般部署于各种嵌入式设备,这意味着低资源、小内存、少计算的要求。因此,为了保证语音关键词识别模型在噪声环境下的鲁棒性,同时满足低功耗的性质,本文的工作如下:1.为了解决缺乏噪声数据集的问题,本文使用了几种来自现实生活场景的噪声以不同的信噪比合成含噪声的数据集,包括用于语音增强模型的VCTK数据集和用于语音关键词识别的谷歌命令词数据集。训练过程中为了对数据进行降噪,分别使用基于SEWUNet网络的语音增强模型和基于频谱子带混合遮掩和频谱归一化等数据增强方法提升识别效果。2.设计语音增强模型和关键词识别模型的联合训练模型。语音增强模型作为关键词识别模型的前端模型,使用改进的基于信噪比的损失函数以及两阶段训练方法提升降噪效果。实验基于不同主干网络的语音关键词识别模型进行对比,结果证明改进的语音增强模型有效的提升了语音质量,联合训练方法比其他不经过语音增强的模型在噪声环境下最高提升了6.7%的关键词识别率。3.针对语音增强模型过大的问题,提出噪声鲁棒的轻量级语音关键词识别模型。在数据预处理阶段使用基于频率的数据增强操作而不是单独的语音增强模型;使用基于变换卷积的主干网络,结合二维频率-时间卷积和一维时间卷积,节约参数量和计算量的同时保留特征提取能力;提出全卷积的相对注意力模块,采用全卷积的结构,以相对比例的方式和主干网络进行融合,使模型学习到重点信息。经测试,提出的模型在噪声环境下的识别率较于联合训练模型提升了3.1%,而参数量仅为联合训练模型的1/300。
其他文献
DSC公司为小微企业,成立近十年的时间里发展困难,频频出现生存危机。通过企业调研发现其员工激励问题十分严重,急需解决,期望DSC公司更好地发展。此类企业在国民经济中起着重要支撑作用,为我国非公有制经济建设做出了重要贡献。但是,目前我国小微企业普遍规模较小,利润水平较低,流动资金不足,雇员较少、人才缺乏,企业自身素质不高,员工缺乏工作积极性。解决存在的员工激励问题迫在眉睫,而有关企业员工激励的研究文
学位
《伊豆舞女》是日本新感觉派代表作家川端康成(1899-1972)的早期成名作,作为著名的日本文学作品先后多次被汉译出版,并收录于我国高中语文选修教材。本论文运用生态翻译学理论,选取《伊豆舞女》及其译本(李德纯译本、林少华译本、叶渭渠译本)作为研究对象,比较和分析三种译本之间的异同,从中厘定出“整合适应选择度”最高的译本。基于生态翻译学理论,针对日本文学作品的汉译提出几点建议,希望能对今后的日本文学
学位
随着半导体制造技术的进步,科研人员成功研发出规模更大、功耗和面积开销却更小的集成电路。然而现代集成电路越来越容易受到高能粒子的撞击,从而引起软错误。这些高能粒子与集成电路的敏感节点发生碰撞,导致单节点翻转。在现代集成电路中,由于更先进的工艺尺寸导致晶体管之间的距离越来越近,高能粒子的撞击可能同时改变两个或三个节点的逻辑状态,从而导致双节点翻转甚至三节点翻转。显然,仅针对单节点翻转的辐射加固方案已经
学位
随着语音识别技术的日益成熟,自然语言交互已然成为主流的人机交互方式。家用机器人对自然语言形式任务的正确理解对于提升其智能化服务水平具有重要意义。目前家用机器人在执行任务时只能理解预先设定的简单指令,而缺乏对复杂、抽象的多任务指令的理解能力。因此,本文提出了一种两阶段的任务理解方法,首先把用户指令按照语义划分为多个框架,即框架语义,从而提高对多任务指令的处理能力;然后将框架语义转换为规划目标,经任务
学位
个人征信,是指按照一定法律程序建立的信用服务机构根据一定的标准对公众的信用信息进行征集、整理、分析,并为公众提供法律规定范围内的个人信用信息查询服务。我国由于信用信息建设起步较晚,仍存在很多公民信用意识较为淡薄,社会信用秩序混乱的情况,部分地区仍处在信用管理缺失的状态。不断构建完善的社会信用体系,是我国实现现代化发展任务的题中之义,而建立起完备的个人征信体系,尤其是在经济较为落后的县域完善个人征信
学位
在中国“走出去”战略中,文化走出去是其尤为重要的环节。文化输出作为中国与沿线国家构建的交流桥梁,能够加快各国的文化交流,促进文化产品贸易的发展,乃至拉动双方经济的快速提升。因此,本文以“一带一路”沿线国家为例,研究文化输出对中国文化产品出口贸易的影响。首先本文分析2006-2018年间中国文化产品出口现状和中国文化输出现状。其次,通过构建DS垄断竞争模型,本文理论分析文化输出对中国文化产品的影响,
学位
背景:2019年末一场生物病毒灾害袭击了中国湖北省武汉市,随后这种高传播性的病毒在我国大规模传播,至今为止这种病毒依然严重威胁着全球人类的生命健康,时至今日,全球累计确诊病例超过4.5亿人次,累计死亡人数超过6百万,这次疫情主要传播的病原体是新型冠状病毒SARS-CoV-2。SARS-CoV-2感染者会出现发热、乏力、味觉嗅觉灵敏度降低等症状,病情严重的感染者会出现呼吸困难、器官衰竭等症状。病情更
学位
扩频通信系统有着十分广泛的应用,其中同步捕获技术最为关键,关系到整个系统的性能,而传统捕获算法受限于奈奎斯特采样,存在数据量与计算量较大的缺陷。为此,引入压缩感知理论,通过将信号进行稀疏表示,以低于奈奎斯特采样率对信号实现压缩采样,降低捕获算法数据量及资源损耗。近年来,随着在深度学习领域的不断加深和完善,各种神经网络开始被人们所重视,深度神经网络因其自学习能力强,自动提取特征,能够高速寻找函数的最
学位
国家的多数保险企业的管理者普遍重视销售团队建设工作,通过积极开展招聘活动、强化销售人员培训机制等方式形成对保险企业经营发展的全面支持。在保险团队开展一系列人力资源管理过程中,薪酬管理工作是非常重要的环节之一,薪酬管理直接影响着销售团队的工作积极性。同时,薪酬管理工作也是保险团队减少销售人员流失、鼓励销售人员积极开发市场的重要手段,合理的薪酬体系能够留任优秀人才并对销售人员进行有效激励,为保险企业的
学位
现代装甲车辆从强调高防护、重火力向轻量化、机动性转变,车辆可靠性成为了不可忽视的问题,也是当前装甲车辆技术研发工作的重要关注点。扭力轴是装甲车辆行走系统中的重要构件,对整车可靠性起着很大的作用,它关系着装甲车辆高机动性发展的前景,因此对装甲车辆扭力轴可靠性的研究工作具有重大意义。本文基于ADAMS动力学软件搭建平台建立履带车辆整车动力学模型。以某型履带车辆为研究对象,搭建多刚体动力学模型,通过有限
学位