基于深度学习的声纹识别算法研究

来源 :燕山大学 | 被引量 : 1次 | 上传用户:jianzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能科技的蓬勃发展,声纹识别逐步受到人们的重视。声纹识别作为生物识别技术的一种,有着很高的商用价值,例如在智能终端、语音助手、人机交互与信息安全等民用及军用领域都发挥着重要的作用。本文分析了深度学习方法在声纹识别领域表现优异的原因,认为在特征提取与融合、损失函数等方面可以做出改进,对改进算法的声纹辨识准确度和模型鲁棒性进行了探讨。本文重点工作和算法创新点如下。首先,因为基于深度学习的声纹识别方法在很大程度上依赖充足的数据集,尤其是在无约束条件下更接近于真实环境、复杂度更强的数据。但现在开源语音数据集的数据类型过于单一,与实际应用环境下采集到的语音存在着一些差异,并且能够使用的中文数据集很少。针对上述问题,本文提出并采集了一个数据类型更加丰富、更接近于真实环境下采集到的无约束中文语音数据集。其次,针对在无约束条件下语音数据集声纹特征提取不充分的问题,基于注意力机制设计新型的二维卷积残差网络结构应用于声纹特征提取。分别通过SE模块和CBAM模块对残差网络中的残差块结构进行改进,得到SE-Cov2d和CSA-Cov2d模型。经实验证明,注意力机制能够帮助网络关注到更重要的特征信息,在特征提取中融合出更具差异性的特征。最后,本文受到人脸识别领域新提出的MagFace损失良好的设计理念启发,提出一种应用在声纹识别领域的损失函数MagSpeaker。同时提出一种多层特征聚合方法,利用跳跃连接和特征拼接的方式进行网络多层信息的补充提升模型识别能力,还使用一种在频谱上添加随机mask的数据增强方法进一步提升模型在小数据集上的性能表现。实验结果表明,以上改进可以提高数据样本的类内紧凑性和类间差异性,加快模型的收敛速度并且具有良好的模型鲁棒性。
其他文献
<正>习近平总书记围绕树立和践行正确政绩观作出一系列重要论述,深刻阐明了“政绩为谁而树、树什么样的政绩、靠什么树政绩”等重大问题。为官之道,首在政绩观。政绩观是世界观、人生观和价值观在领导干部身上的具体体现,是衡量领导干部履职尽责、干事创业的一把标尺。如果领导干部对政绩问题认识不科学,
期刊
<正>元丰(2)六年十月十二日夜,解衣欲(3)睡,月色入户,欣然起行。念无与为乐者(4),遂至承天寺寻张怀民。怀民亦未寝,相与(5)步于中庭(6)。庭下如积水空明(7),水中藻荇(8)交横,盖(9)竹柏影也。何夜无月?何处无竹柏?但(10)少闲人如吾两人者(11)耳(12)。译文元丰六年十月十二日夜晚,(我)解衣打算睡觉,月光从门户照进来,于是高兴地起身出门。想到没有(和我)一起分享这种快乐的人,
期刊
正交频分复用(OFDM)系统是无线通信网络中一种常用的多载波调制技术,具有频谱利用率高,抗多径干扰的特性。OFDM信号是由多个子载波叠加形成的,当各个子载波的幅值相近或者相等时,就会产生瞬时峰值信号,进而导致较高的峰值平均功率比(PAPR)问题。高峰均比的信号极易进入功率放大器等有源器件的非线性工作范围,导致信号出现失真,影响系统的传输性能。部分传输序列(PTS)是一种降低OFDM系统峰均比的方法
学位
旨在探究不同添加水平包被复合微量元素对黄羽肉鸡血清生化指标、抗氧化和免疫能力的影响,并确定适宜添加水平。试验选取1日龄体质量为(32.61±0.60) g、健康状况良好的雄性黄羽肉鸡300只,随机分为5个处理组(A、B、C、D、E组),每组6个重复,每个重复10只鸡。处理组A、B、C、D、E组分别在基础饲粮中添加200,400,600,800,1 000 mg/kg包被复合微量元素。试验分为1~2
期刊
四旋翼无人机姿态解算及姿态控制是其导航中基础问题之一,随着微机电系统(Micro-Electro-Mechanical System,MEMS)技术的发展,MEMS惯性传感器成本越来越低,精度越来越高,性能越来越强,极大地促进了四旋翼无人机的发展。又因为四旋翼飞行器可以在空中灵活运动亦可悬停,引发众多学者的广泛研究,也取得了显著的成果,四旋翼无人机已经涉及人们的日常生活,如航拍摄影、快递运输、农药
学位
在木门加工生产线上针对大跨距龙门机器人对不同尺寸板材分拣的需求,本文基于计算机视觉技术对大跨距龙门机器人智能分拣及定位方法进行了研究。主要内容如下:首先,设计并构建了基于Clinet/Server架构的龙门机器人智能分拣系统。该系统基于服务器端与客户端架构,通过虚拟仿真系统、实验室仿真平台和工厂真实大跨距龙门机器人平台,实现了由虚拟到真实的分层开发。并构建了虚拟数据集、实验数据集和真实数据集,为在
学位
随着汽车数量的逐渐增加,智能交通的发展成为缓解道路拥堵、减少交通事故、降低环境污染的一种途径,其中车辆队列控制能够提升公路系统运行效率以及安全性。但是车辆在行驶过程中会遭受到风速,参数不确定性,空气阻力等扰动的影响,以及受限于车辆本身的物理特性,执行器和传感器等器件在工程实际应用时不可避免会因老化,损坏等问题产生故障,上述因素给车辆队列控制带来了一定的挑战。因此,根据车辆队列遭受到的不同外界条件,
学位
准确的电力负荷预测对于电力系统的安全经济运行具有重要意义。在传统的电力负荷预测研究中,研究者们通常考虑气温、湿度、假期等因素对电力负荷的影响,并未考虑搜索引擎指数和COVID-19疫情因素,而这2个因素在当前情况下同样与电力负荷具有相关性,搜索引擎指数与电力负荷的相关性在人流量大的旅游区域表现得更为明显,而COVID-19疫情在2020年后成为了新出现的对电力负荷有影响的因素。本文提出了考虑搜索引
学位
专利是授予发明者在一定时期内保护其发明的法定权利,在当今的人工创新中发挥着重要作用。现有的研究工作并没有针对专利相似度数据进行适配优化,导致其应用在专利短语相似度匹配任务上效果不佳。先前的研究表明,在低资源的场景下,提示学习将文本片段(即模板)插入到输入中,将分类问题转换为掩码语言建模问题,其关键的一步是在标签空间和标签词空间之间构造一个投影。本文提出一种基于知识注入的提示学习方法,将其应用于专利
期刊
<正>俄罗斯克麦罗沃心血管疾病综合问题科研所专家们在制造小口径人造心血管道路上迈出了新的步伐,相关血管植入生命机体后可减少形成血栓的风险。研究人员已能展示他们所制造的人造血管在大型实验室动物体上的相对效果。人工合成血管与血液和周围组织相互作用并在植入后很快会形成一层血栓,对患者的血液和生命构成威胁。因此制造一种可产生最小量血栓的人造血管成为一个研究方向。据悉,研究人员给35只绵羊的颈动脉里植入了人
会议