基于新型损失函数DV-Softmax的声纹识别方法

来源 :吉林大学学报(工学版) | 被引量 : 0次 | 上传用户:snake_icy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对声纹识别领域中现有模型分类损失函数无法有效的区分类别之间的可分性与缺乏对声纹数据质量关注的问题,本文提出一种新的分类损失函数DV-Softmax。首先,介绍了声纹领域现有边界损失函数工作原理;其次,介绍目标检测领域的挖掘损失函数,并在其基础上提出模糊样本的概念;然后,引入人脸识别领域的MV-Softmax损失函数,并加入模糊样本,使其能自适应强调不同样本之间的区别并指导特征学习;最后,分别在Voxceleb1和SITW数据进行声纹识别的研究。实验结果表明,DV-Softmax损失函数相较于现有边界损失函数,等错误率分别下降8%和5.4%,其验证了该损失函数有效解决类别之间的可分性以及对样本声纹数据质量的关注,并在声纹识别领域具有良好的性能。
其他文献
介绍了一种新型耐磨免喷涂聚碳酸酯/聚对苯二甲酸丁二酯合金材料的制备方法,并对其进行性能测试。通过选用特定的聚对苯二甲酸丁二酯、玻璃纤维、第二填料进行制备,聚碳酸酯/聚对苯二甲酸丁二酯合金材料具有优异的介电性能、刚韧平衡性、加工性,以及高金属接合力,材料颗粒均匀,性能稳定。所做研究成果为实现更环保、更经济的高性能复合材料的制备提供了理论依据和实践参考。
期刊
<正>党的十八大以来,以习近平同志为核心的党中央坚持以新国家粮食安全观为指导,坚定实施国家粮食安全战略,立足世情国情粮情的深刻变化,作出了藏粮于地、藏粮于技的重大决策。习近平对实施藏粮于地、藏粮于技战略进行了深邃思考,提出了一系列政策举措,有力推动了国家粮食安全理论创新和实践创新。一、藏粮于地、藏粮于技战略的形成背景藏粮于地、藏粮于技,是以习近平同志为核心的党中央坚持以底线思维审视我国粮食安全态势
期刊
针对现有方法对电力变压器状态监测不够全面的问题,基于声纹特征识别技术进行了电力变压器运维检测方法研究。构建了电力变压器声纹信号的梅尔倒频谱系数(MFCC)特征,并提出了基于深度置信网络(DBN)与支持向量数据状态描述(SVDD)的电力变压器缺陷状态识别算法。同时利用DBN模型对MFCC特征进行学习训练,完成对深度声纹特征的提取。通过SVDD算法对声纹特征与缺陷类型进行关联分析,以实现缺陷类型的精准
期刊
报纸
变压器铁芯轻微松动故障给变压器安全稳定运行留下巨大隐患,目前尚缺乏切实可靠的诊断方法。提出一种基于多传感器融合声纹特征图谱的变压器铁芯松动故障诊断方法。首先,利用4个传感器采集声纹时序序列,通过小波变换生成声纹特征图谱,利用熵权法确定不同传感器信号的权重分配,将4个声纹特征图谱加权融合,从而形成多传感器融合声纹特征图谱。其次,将融合声纹特征图谱输入优化后的ShuffleNetV2模型,通过分组卷积
期刊
变压器运行过程中产生的振动噪声与其运行状态及内部缺陷情况直接相关,对其声纹信号开展特征分析,有助于进一步了解设备运行工况,保障电力系统安全稳定运行。文中以声纹特征分析为基础,兼顾诊断效率与准确性,提出一种基于卷积神经网络及集成学习模型的变压器缺陷诊断方法。该方法以变压器声纹数据的时域及频域信号为多通道输入混合特征,构建了基于卷积神经网络模型和声纹特征分析法的集成学习模型,可实现变压器声纹特征的有效
期刊
利用语音听觉特征的特征表现,根据辨听人对语音听觉特征的听辨结果,对2段语音进行赋值化表述,采用比较研究法,根据语音听觉特征赋值加成结果判断2段语音相似程度。结果显示,引入表格,使声纹辨听过程操作性更强,得出结果的过程更加直观规范。因此,语音听觉特征在声纹辨听比对工作中具有很强反映性和稳定性,利用语音听觉特征能够快速直接判断2段语音的相似程度,过程快速、易操作,流程规范,结果反馈直观,在声纹比对中发
期刊
800米跑是国家体质健康测试和体育中考中用来评价初中女生耐力素质的一个必测项目,教育部连续6年的“全国学生体质与健康调研”显示,我国初中女生耐力素质逐年下降。故探索初中女生耐力素质练习的新思路、新手段,以达提升运动成绩的目的,成为当前初中女生耐久跑教学改革的目标。传统观念认为力量练习会带来肌肉肥大,不利于800米跑竞技能力的提高。但近年有大量研究表明力量的作用已经突破传统的意义,合理的力量练习可以
学位
目前,大多数声纹识别模型在无噪音环境中的识别准确率较高。而在噪音环境中,声纹识别模型的识别准确率通常会迅速下降[1]。在实际应用中受检验对象不同状态及获取样本所使用录音设备、环境等客观因素的影响,办案人员采集的声纹信息样本往往质量不佳,从而难以做出准确判断[2]。为提高声纹识别的准确率,在改善采集样本质量、节约成本、方便使用的基础上,提出研制一种可减少回响和噪音,用于声纹信息采集的隔音箱。
期刊
针对声纹识别领域中基于传统Res2Net模型特征表达能力不足、泛化能力不强的问题,提出了一种结合稠密连接与残差连接的特征提取模块SE-DR-Res2Block(Sequeeze and excitation with dense and residual connected Res2Block).首先,介绍了应用传统Res2Block的ECAPA-TDNN(Emphasized channel a
期刊