【摘 要】
:
随着科学与社会的发展,人们对语音识别技术提出了更加苛刻的要求。其中,单人语音识别技术已经发展到了较高水平,但是对于多人语音信号的识别效果并不理想,主要表现在难以确定说话人的身份,即某段语音是由哪个人说的。针对这个问题,本文将语音分离与说话人识别相结合,提出一种多人混合语音信号的识别技术,该技术主要用于多人语音信号的身份鉴别,对于语音内容的识别则不关注。本文的研究内容主要包括语音分离和说话人识别两部
论文部分内容阅读
随着科学与社会的发展,人们对语音识别技术提出了更加苛刻的要求。其中,单人语音识别技术已经发展到了较高水平,但是对于多人语音信号的识别效果并不理想,主要表现在难以确定说话人的身份,即某段语音是由哪个人说的。针对这个问题,本文将语音分离与说话人识别相结合,提出一种多人混合语音信号的识别技术,该技术主要用于多人语音信号的身份鉴别,对于语音内容的识别则不关注。本文的研究内容主要包括语音分离和说话人识别两部分:1、语音分离:现阶段常用的语音分离模型大多基于循环神经网络,不能有效利用语音信号的空间特征信息。针对这一问题本文提出了一种基于卷积神经网络、门控循环单元与注意力机制的CNN-GRU-Attention模型,以幅度谱作为输入,通过卷积神经网络提取幅度谱的空间特征,采用门控循环单元对时序信息进行建模。针对长序列信息容易丢失的问题在模型中引入注意力机制模块Attention Cell Wrapper,使神经网络借助序列信息识别各部分的重要性,改善语音分离效果。通过对比实验,验证了模型相对于传统语音分离模型的优越性能,全局归一信号失真比达到了7.8d B,全局信号干扰比达到了13.8d B。2、说话人识别:针对说话人识别问题建立了基于残差神经网络、门控循环单元与注意力机制的说话人识别模型。将语音信号进行预加重、特征参数提取等处理后,输入残差网络提取特征信息,由于卷积过程中产生大量通道,含有噪声与静音段等冗余信息,针对这一问题引入了注意力机制模块SEnet改进模型,对包含重要信息的通道给予更大的关注,提升识别效果。然后经过门控循环单元处理时序信息。选用了三元损失函数对网络进行训练,提升了对于相似样本的识别效果。最后设计对比试验,实验结果表明本文提出的说话人识别模型的等错误率达到了4%,识别准确率达到了91.5%,效果优于传统的高斯混合模型与DNN-based i-vector方法。
其他文献
<正>茅盾先生一生享寿84岁,著译生涯长达70年许,笔耕勤快,作品宏富。人民文学出版社所出的《茅盾全集》收茅盾60余年的各类著述(不包括翻译作品和古籍选注、眉批等),按文体分类编年,多达40卷;以至于编辑出版周期长达22年(从1984年到2006年)。黄山书社于2014年推出新版《茅盾全集》(由茅盾之子韦韬授权,中国茅盾研究会原副会长钟桂松主编),是在人民文学出版社版的基础上加以充实、补订而成,更
数据密集研究范式主导的数据水文学正在成为水文研究的一个重要方向,而善于从大量数据中挖掘规律的深度学习理论推动了近年来数据驱动水文预报的研究热潮,并不断和水文学科融合,逐步成为数据水文学的重要研究方法体系。从深度学习与水文预报学科交叉的角度,简要介绍水文领域常用深度学习模型的原理与结构及其应用于水文预报中的一般建模方法,在此基础上进一步介绍深度学习与水文物理机制整合的基本方法,以期为相关研究人员开展
随着积极心理学的不断发展,从挖掘内在心理积极因素的角度促进个体工作投入逐渐受到重视。本次调查选用280名幼儿教师为被试,采用问卷法研究幼儿教师工作价值与工作投入的关系,以及工作幸福感的中介作用。结果发现:幼儿教师工作价值观呈中等偏上水平;幼儿教师工作价值观对工作投入有显著的正向预测作用;工作幸福感在幼儿教师工作价值观和工作投入之间起到部分中介效应。
<正>铜政[2021]2号县、区人民政府,市政府各部门,各有关单位:为保障国家建设用地需要,维护农民群众合法权益,根据《中华人民共和国土地管理法》和《安徽省人民政府关于公布全省征地区片综合地价标准的通知》(皖政[2020]32号)有关规定,结合我市实际,决定调整我市被征收集体土地上房屋、青苗和地上附着物征收补偿标准及相关政策。现将有关事项通知如下:
<正>12月17日,浙江传媒学院电视编辑与导播国家级实验教学示范中心与中科大洋共建的大洋智能媒体业务实验室举办合作协议签约仪式。本次校企联动,双方将以浙江传媒学院电视编辑与导播国家级实验教学示范中心、省级影视摄制技术与艺术创研虚拟教研室为基地,聚焦于智能媒体教学场景构建研究与建设、人才培养与实践创新课程共建两个方面,在传媒实践教学中进行智能媒体技术、业务创新活动。
2022冬奥会和冬残奥会都已圆满落下帷幕,其间不仅有令人难忘、激动人心的夺金瞬间,更散发着无处不在的科技之光。从智慧防疫到智慧物流、智慧服务、智慧餐厅、智慧媒体,冬奥会中的机器人身影随处可见。这些机器人除了提供以上服务的服务型机器人还有水下传递火炬的火炬机器人,辅助冰壶运动员训练的冰壶机器人以及雪场的滑雪机器人等特种机器人。“十三五”期间,我国机器人产业发展势头良好。工信部公开的数据显示,从规模上
目的:观察电针对卵巢储备功能下降(DOR)患者子宫内膜容受性和体外受精-胚胎移植(IVF-ET)妊娠结局的影响。方法:将68例拟行IVF-ET的DOR患者随机分为观察组(34例,脱落2例)和对照组(34例,脱落1例)。对照组采用常规方案进行内膜准备;在对照组治疗基础上,观察组于膈俞、肾俞、命门、十七椎、次髎、中髎、天枢、气海、关元等穴行针刺治疗,同侧次髎、中髎,天枢、子宫连接电针,疏密波,频率2H
<正>随着现代电影文化的发展,服装造型设计作为电影重要的元素,逐渐成为塑造人物形象、推动故事情节发展、渲染电影情感的有效推力,在电影拍摄中占据着不可或缺的地位。同时,电影的广泛传播使影视服装深受大众喜爱,引领了新的服装时尚潮流,有效带动了服饰产业的经济发展。因此,深入研究电影服饰,把握影视人物与服饰造型之间的内在关联,成为现代服装设计创新发展的必然要求。
“六卓越一拔尖”计划2.0是国家加快建设高等教育强国的重要举措,包括公安院校在内的各高校都在推进卓越人才培养工作。作为专门用途英语教学的警务英语在培养公安院校大学生的国家意识、人文情怀、国际视野以及跨文化比较能力、自主学习能力和可持续发展能力等方面具有独特价值。其教学改革应当服务于卓越警务人才培养需求,聚焦于课程、教学、教师、教材四个维度,采取目标导向、夯实内涵,价值引领、技术赋能,以研促教、提升
我国场地重金属污染状况严重,全国工业场地土壤超标率已达36.3%,成为制约城市土地资源更新利用的重要因素,其中铬污染场地问题尤为突出。针对这一问题,高温固化技术可将污染土壤重新成为建筑材料再利用,但高温固化的材料安全性能及其重金属固化机理研究,较为薄弱。因此,本研究利用化学还原和高温固化协同的方式修复铬污染土壤,以韶关某铬污染场地为研究对象,选用三种还原剂(硫酸亚铁、多硫化钙、硫化钠)将土壤中的六