基于深度学习的开放场景下声纹识别系统的设计与实现

来源 :南京信息工程大学学报 | 被引量 : 0次 | 上传用户:liongliong517
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求.
其他文献
明确土壤N2O排放来源是阐明N2O产生机制、估算氮肥排放系数的关键.为探究外源氮施用对土壤-作物系统N2O排放的影响,以潮土为研究对象,以玉米为供试作物,设置未施氮肥未种植玉米(N0P0)、未施氮肥种植玉米(N0P1)、施氮肥未种植玉米(N1P0)、施氮肥种植玉米(N1P1)4个处理,采用15N示踪方法区分N2O排放来源,定量解析N2O排放规律.结果 显示,与未施氮处理相比,外源氮施用显著增加土壤N2O排放总量(P<0.05),土壤本底及氮肥对N2O排放总量的贡献分别为22.5%和77.5%.种植玉米和未
为掌握射阳湖国家级水产种质资源保护区环境质量状况,在保护区核心区外围(S1~S6)和核心区内(S7~S11)共设置11个站位,监测该水域2018年5月至2019年2月水环境质量的季节变化情况,并选择代表性站位,测定底泥中碳、氮、硫含量以及氮循环细菌功能基因丰度.基于监测数据,运用综合营养状态指数法(TLI)评价射阳湖水环境现状,采用插值法探讨射阳湖水体氮、磷浓度的时空变化,并分析氮循环功能基因与主要环境因子间的相关性.结果 表明,射阳湖水域存在轻度富营养化问题,总氮和总磷平均浓度最高值分别出现在冬季[(1
在现实世界,系统都具有复杂性.首先,系统本身是复杂的:结构复杂,如具有非线性;机理复杂,如存在滞后作用;参数复杂,一是参数多,二是参数时变,有的难以确定.其次,系统环境可能复杂,如系统与系统之间存在耦合与相互作用,如网络化环境等.系统的复杂性带来系统行为和性质的复杂性,如混沌、分叉与震荡,如神经网络在对抗性攻击下的脆弱性,等等.正因为如此,复杂系统具有重要的研究意义,也存在巨大的挑战.
期刊
以普通污泥基生物炭和铁改性污泥基生物炭为钝化剂,以油菜上海青(Brassica chinensis,珍品66)为植物标志物,采用盆栽试验研究不同砷污染浓度(20、40、60和100 mg· kg-1)条件下两种生物炭对砷污染土壤的稳定修复效果.结果 表明:施加生物炭后,土壤中硫、磷、铁和铝含量均明显增加,铁改性污泥基生物炭处理组铝含量较普通污泥基生物炭处理组平均低4.64 mg·g-1.生物炭的添加使土壤中有效态砷含量减少16.9%~33.6%,而固定态砷比例增加8.3%~31.0%.与施加普通污泥基生物
沼液还田是畜禽养殖粪污消纳的重要方式,但也会增加氮素流失引起的面源污染风险.采用沼液高负荷灌溉土柱试验方法,设计等量一次灌溉(T1)、等量分次灌溉(T2)和等量一次灌溉种植黑麦草(T3)3个处理,以复合肥(CK1)和无肥灌溉(CK2)为对照,持续灌溉78 d,考察土壤氮素积累,同时收集土柱底部的下渗液以监测沼液灌溉后的氮素淋溶情况;采用Illumina MiSeq高通量测序方法分析高负荷沼液灌溉后土壤微生物多样性及群落结构.在沼液灌溉前期3种处理方式均很快表现为氮素在土壤上层(0~20 cm)和中层(>2
采用相转化法制备不锈钢中空纤维载体,系统考察空气间距、芯液流速和纺丝液中水含量等制备条件对多孔不锈钢中空纤维载体微结构及性能的影响.结果 表明,随着空气间距的增加,中空纤维载体海绵层逐渐变薄;随着芯液流速的增加,中空纤维载体截面整体形状逐渐呈规整的圆形载体壁变薄;随着水含量的增加,纺丝液的黏度不断增加,中空纤维载体断面逐渐由典型的“三明治”结构变成双层非对称结构.当空气间距为10 cm、芯液流速为20 mL/min、纺丝液中水质量分数为2%时,其N2渗透性可达1.59× 10-4 mol/(m2·s ·P
钢铝异种金属焊接中,由于钢铝两种材料的热物理性能和化学结晶性能相差较大,导致其焊接性极差.本文通过正交试验确定了钢铝焊接的最佳工艺参数,之后采用最佳工艺参数,研究了添加铜、锌薄片后钢铝电子束焊接性能的变化.结果显示铜的添加对改善钢铝焊接性有比较明显的效果.
在实际工程中,网络化控制系统的采样间隔往往受到不可预知的物理约束,而这会导致噪声采样区间,也就是实际采样区间以一定的概率分布围绕着理想采样周期随机波动.本文研究噪声采样区间下具有随机短时滞的网络化系统镇定问题.首先利用离散时间方法建立一个闭环随机系统模型,但由于采样噪声和时变短时滞都具有随机性,因此,闭环随机系统模型的系统矩阵具有高度非线性和双重随机性.为了解决系统矩阵的高度非线性和双重随机性给镇定控制器设计带来的困难,本文利用汇合范德蒙矩阵方法和克罗内克积运算,计算出与系统矩阵相关的三个矩阵乘积的数学期
本文考虑了一类非线性中立型随机延迟微分方程,其漂移项系数和扩散项系数均是超线性增长的,且中立项满足压缩映射条件.本文建立了这类方程的截断型θ-EM算法,并得到了其收敛率.最后,给出一个例子验证了理论结果.
基于观测器的离散马氏跳变系统(D-MJSs)是随机的,但系统待估计的故障是确定性信号,因此很难直接研究该系统的故障估计问题.针对该问题,本文提出一种构造辅助系统方法,通过对随机变量取期望来构造确定性的中间变量,进而建立的中间估计器可以同时估计系统状态和故障.此外,基于一种新的放缩手段,进一步考虑转移概率矩阵(TPM)不确定的情况.所有条件均以线性矩阵不等式(LMIs)给出,并保证状态误差是输入状态稳定的.数值仿真算例验证了所提方法的有效性和优越性.