【摘 要】
:
近些年来,多种基于卷积神经网络(CNNs)的模型结构表现出越来越强的多尺度特征表达能力,在说话人识别的各项任务中取得了持续的性能提升。然而,目前大多数方法只能利用更深更宽的网络结构来提升性能。该文引入一种更高效的多尺度说话人特征提取框架Res2Net,并对它的模块结构进行了改进。它以一种更细粒化的工作方式,获得多种感受野的组合,从而获得多种不同尺度组合的特征表达。实验表明,该方法在参数量几乎不变的
【机 构】
:
中国科学院声学研究所语言声学与内容理解重点实验室 北京 100190;中国科学院大学 北京 100049;国家计算机网络应急技术处理协调中心 北京 100029;中国科学院声学研究所语言声学与内容理解
论文部分内容阅读
近些年来,多种基于卷积神经网络(CNNs)的模型结构表现出越来越强的多尺度特征表达能力,在说话人识别的各项任务中取得了持续的性能提升。然而,目前大多数方法只能利用更深更宽的网络结构来提升性能。该文引入一种更高效的多尺度说话人特征提取框架Res2Net,并对它的模块结构进行了改进。它以一种更细粒化的工作方式,获得多种感受野的组合,从而获得多种不同尺度组合的特征表达。实验表明,该方法在参数量几乎不变的情况下,等错误率(EER)相较ResNet有20%的下降,并且在VoxCeleb, SITW等多种不同录
其他文献
针对欠采样脉冲多普勒雷达信号参数估计中已有方法抗噪性差、顺序参数估计方法中后续参数估计受前面参数估计精度影响严重等问题,该文提出一种基于有限新息率(Finite Rate of Innovation, FRI)采样的频域时延-多普勒2维聚焦(FD2TF)算法。在该算法中,利用FRI采样结构能够以低于奈奎斯特采样频率的速率获得信号的一系列傅里叶系数,通过频域2维聚焦过程能够同时估计时延和多普勒参数,
针对现有的张力传感器结构复杂成本高、在实际工作过程中密封性难以达到要求、在高温高湿的环境下工作时容易造成传感器内部零件损坏的问题,设计了一种新型简易张力检测装置.通过简单的机械零件组合,用测力弹簧替代张力传感器获得张力值,降低了成本,简化了结构.
通过对传统带呼吸阀口罩生产线的研究,针对现有呼吸阀口罩打阀机存在生产效率低及工人容易受伤的现象,设计了一款半自动呼吸阀口罩打阀机,代替人工自动完成呼吸阀的装填,实现呼吸阀与无纺布口罩的焊接.使用振动盘实现自动送料,气缸作为传动机构,真空吸盘作为执行机构实现对单个呼吸阀的吸附固定.利用PLC和触摸屏HMI作为控制系统,下位机采用PLC对各传感器信号接受处理并控制电磁阀,上位机采用触摸屏HMI监测各装置运行状态,通过RS232通讯串口实现对PLC命令发送.通过制作实物模型进行试验,验证了设计可行性.
基于毫米波雷达的机场异物(FOD)检测技术具有高分辨率和低功耗的特点,但是传统恒虚警(CFAR)类检测算法在低信杂比(SCR)情况下虚警过高。该文提出一种基于Duffing振子的FOD检测算法。该算法首先利用杂波图CFAR检测算法将雷达接收机接收回波中的背景杂波初步分离,获得目标(包含虚警)的距离信息,并利用该信息构造Duffing方程,之后将此方程作为系统检测模型,输入接收回波信号,求解输出信号
针对自动驾驶中有限平台空间及发射功率导致毫米波雷达目标检测性能较低的问题,该文提出一种距离及速度分辨率约束下提升毫米波雷达目标检测概率的波形参数及接收权联合设计方法。首先,基于调频连续波(FMCW)信号,所提方法建立了毫米波相控阵阵列检测模型;其次,通过分析距离及速度分辨率与发射波形参数关系,构建考虑距离及速度分辨率的发射波形参数约束;然后,基于最大化输出信杂噪比(SCNR)准则,建立具有距离及速
针对现有多基地雷达抗欺骗式干扰方法无法应用于多干扰源的问题,该文提出一种基于聚类分析的多基地雷达鉴别有源假目标方法,利用真假目标接收信号矢量之间相关性的差异,以相关系数为度量,通过聚类分析方法,将相同干扰源产生的假目标聚为一类,每个真实目标各为一类,实现有源假目标的有效鉴别。该方法可用于鉴别任意欺骗调制方式产生的有源假目标,且适用于多个干扰源实施分布式干扰的应用场景。最后,通过仿真实验,验证了所提
针对现有的碳纤维干燥机存在加热效率低、结构复杂等问题,设计了一种液压油加热的七辊筒碳纤维干燥机,使用液压油解决了加热效率低的问题.利用ANSYS对干燥机的结构部件进行静力学分析,分析结果表明各部件均满足设计要求.
通过对异形垫圈的冲裁工艺分析,采用“一冲二”的直对排排样方式,并确定模具为六工位的连续冲裁模结构.模具采用L型承料装置,可在一定程度上平衡冲裁过程中冲头对凹模的侧向力;为保证卸料顺畅,设计了等高套筒弹压卸料装置.同时,为实现凸模的快速换修和装配,设计了一种快换凸模结构——卡槽式快换凸模,降低了钳工的修配工作量,提高了冲压生产效率,尤其适用于模具刃口形状复杂、局部薄弱、需要经常维修和更换的连续冲压模场合.
现有的基于声场干涉结构特征的目标深度分类方法的频率适用范围有限,仅适用于目标线谱频率激发前2阶简正波的情况。针对上述问题,该文提出基于匹配场处理的目标深度分类算法,该算法将垂直复声强无功分量作为匹配量进行目标深度的匹配估计,利用目标深度的粗略估计结果辅助进行目标深度的二元分类。算法适用于线谱频率激发前3阶简正波的情况,有效拓展了算法的频率适用范围。仿真结果验证了算法的可行性和稳健性。该文分析了环境
随着人机交互的发展,手势识别越来越重要。同时,移动端应用发展迅速,将人机交互技术在移动端实现是一个发展趋势。该文提出一种改进YOLOv4-tiny的手势识别算法。首先,在YOLOv4-tiny网络基础上,添加空间金字塔池化(SPP)模块,融合了图像的局部和全局特征,增强网络的准确定位能力。其次,在YOLOv4-tiny原网络的3个最大池化层和新增SPP模块后各添加一个1×1的卷积模块,减少了网络的