【摘 要】
:
针对无文本说话人识别存在短语音提取特征困难和模型训练效率不高的问题,提出利用附加角裕度的损失函数(Additive angular margin loss,AAM-Softmax)可以在特征表达的角度空间中最大化分类界限的优势,同时结合为提高网络训练效率和稳定性而改进的残差网络ResNet,来获得更具辨别性的嵌入特征,最终达到提升端到端短语音无文本说话人识别模型的性能.实验表明,在说话人辨认任务中Top-1和Top-5的准确度分别达到90.1%和97.8%,说话人确认任务中的等错误率(EER)降低到3.8
【机 构】
:
河北大学电子信息工程学院,河北 保定 071000
论文部分内容阅读
针对无文本说话人识别存在短语音提取特征困难和模型训练效率不高的问题,提出利用附加角裕度的损失函数(Additive angular margin loss,AAM-Softmax)可以在特征表达的角度空间中最大化分类界限的优势,同时结合为提高网络训练效率和稳定性而改进的残差网络ResNet,来获得更具辨别性的嵌入特征,最终达到提升端到端短语音无文本说话人识别模型的性能.实验表明,在说话人辨认任务中Top-1和Top-5的准确度分别达到90.1%和97.8%,说话人确认任务中的等错误率(EER)降低到3.8%,与基于VoxCeleb1数据集的已有成果相比,三种指标的性能皆有明显提升,证明了所提方法的有效性.
其他文献
超透镜是超表面在成像领域中具有较大应用潜力的平面光学器件,能够精确调控光的相位、振幅、偏振等信息、兼容互补金属氧化物半导体(Complementary Metal Oxide Semiconduc-tor,CMOS)制造工艺,在器件轻量化和批量化制造等方面具有很大的发展前景.针对近红外成像镜头的轻量化需求,使用时域有限差分(finite-difference time-domain,FDTD)软件设计仿真了工作波长为800 nm的硅基偏振不敏感超透镜,镜头厚度小于0.5 mm,数值孔径为0.41时聚集效率
为解决实际提取视频监控系统斑点特征时,视频图像背景元素与斑点间产生混淆,导致斑点特征与背景元素间的相似性过大的问题,研究一种光感传感器的视频监控系统斑点特征提取方法.定义视频图像内的背景信息后,挖掘光感传感器斑点特征信息,整合斑点特征信息为一个集合,逆变换处理重建视频监控系统中的分辨率,等效处理斑点各项信息为统一的计量尺度,设定一个时频脊线参数,控制视频图像内的背景元素与斑点特征间的差异性.设计对比实验,实验结果表明:设计的特征提取方法得到的相似性数值最小,在0.2左右.
为了提升RDF数据差异性检测效果,降低光纤网络数据入侵风险,设计基于光纤耦合的RDF数据差异性检测系统.以CAIDS检测架构作为底层数据调配结构,在连接RDF双核处理器与数据过滤模块的同时,实现检测系统的硬件执行环境搭建.以RDF型数据查询结果为标准,利用耦合光束的质量水平评价结果,将所有信息参量全部转存至数据库结构体之中,实现系统的软件执行环境搭建;连接相关硬件设备主机,完成基于光纤耦合的RDF数据差异性检测系统设计.对比实验结果表明,与云架构检测系统相比,光纤耦合型检测系统所能承担的入侵数据量水平更高
为了实现过度曝光激光图像的识别能力,提出基于视觉传达技术的过度曝光激光图像修复方法.在大气散射环境下构建过度曝光激光图像的信息采集和特征分析模型,采用多分辨传感基阵实现过度曝光激光图像的信息融合处理,采用模糊度特征匹配的方法,实现过度曝光激光图像的模糊信息点标记,采用饱和度融合规则进行过度曝光激光图像的模糊点修复和特征聚类处理,提取过度曝光激光图像显著特征量,使用亮度分量融合的方法实现过度曝光激光图像特征细节透射分析,对提取的过度曝光激光图像的边界细节特征量,采用先验样本知识估计的方法,对过度曝光激光图像
Lageos卫星是专用地球动力学卫星,其卫星激光测距数据质量的提升对地球动力学研究具有重要意义。基于Lageos卫星激光角反射器分布,推导了不同层级角反射器回波与反射深度的关系,建立了Lageos卫星前沿回波数据提取模型,并将其应用于上海天文台卫星激光测距数据预处理,验证了该提取模型生成标准点的数据质量改善情况:内符合实验结果表明采用前沿数据提取模型生成的标准点距离参考线的标准差由3.37 mm减
通过稳态速率方程和热传导方程建立了高功率光纤放大器热光耦合的有限元模型,利用该模型对受激拉曼散射致模式不稳定效应进行了数值研究.对增益光纤为25/400μm的正向泵浦激光放大器,受激拉曼散射导致激光器信号光高阶模比例上升,当高阶模的比例达到5%左右时,模场发生畸变,信号光出现了百毫秒量级的模式耦合,这与实验中观察到光强波动现象一致.本文仿真模型为研究高功率光纤放大器中受激拉曼散射和模式不稳定的关系提供了分析手段.
红外图像目标跟踪过程中,受复杂背景环境影响,易被遮挡导致目标丢失,针对这一问题,研究基于抗遮挡能力的红外图像目标跟踪方法.将Mean Shift算法应用于红外图像目标跟踪过程中,在初始帧内人为确定区域选取目标模板,统计目标区域内全部像素值,构建目标模型;在后续各帧内,利用候选区域定义有可能包含移动目标的部分,构建候选目标模型;采用Bhattacharyya系数作为相似度标准,构建相似性度量函数,确定令目标模型概率密度和中心坐标位置特征分布相似度最高的点,基于此确定跟踪目标当前帧出现概率最大的位置,并将该位
为解决交通流量变化较大时段内信号灯控制效果不理想的问题,缓解城市交通的拥堵情况,设计基于车载激光雷达技术的交通智能控制系统.以ARM处理器为核心元件,按需连接主控电路、黄闪模块两类智能化设备主机,实现交通控制系统的硬件执行环境搭建.在此基础上,采集各类激光点云数据样本,通过提取车辆特征的方式,确定待识别的行人目标参量,实现系统的软件执行环境搭建,结合相关硬件设备结构,完成基于车载激光雷达技术的交通智能控制系统设计.实验结果表明,与BP型、交叉型交通控制系统相比,基于车载激光雷达技术交通智能控制系统可同时干
主动式三角对焦法因其结构简单、测试速度快、使用方便灵活等优点,在自动化生产、工业测量等领域有着的巨大应用价值而受到广泛关注。但是在面对小目标被测物体或具有如曲率较大等非常规表面的物体时存在可能丢失目标的问题。针对这一问题,综合LED具有大照明视场的特点,本文提出了一种基于LED的小目标主动式三角对焦方法,从理论和实验两方面对该方法测量小目标和非常规表面物体距离的能力进行了验证。实验结果表明,该模型
针对国内现有激光告警系统波段范围较窄、视场角小等问题,设计并搭建一种光栅衍射型宽波段大视场二维激光告警系统,可实现100°大视场角、450 nm~1600 nm范围波段内对来袭激光进行探测,同时测得来袭激光的二维方向信息及波长信息.通过对系统采集的图片进行分析,设计两点校正算法对探测器进行非均匀性校正,并进行衍射光斑中心提取,最后根据激光告警原理计算求得来袭激光的方位角、俯仰角及波长信息.实验选用波长为1313 nm的激光器对宽波段大视场的二维激光告警系统进行测试,结果显示角度分辨率≤0.67°.