结合双流网络和双向五元组损失的跨人脸-语音匹配

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:twpt168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部视觉信息和语音信息是人机交互过程中最为直接和灵活的方式,从而基于智能方式的人脸和语音跨模态感知吸引了国内外研究学者的广泛关注.然而,由于人脸-语音样本的异质性以及语义鸿沟问题,现有方法并不能很好地解决一些难度比较高的跨人脸-语音匹配任务.提出了一种结合双流网络和双向五元组损失的跨人脸-语音特征学习框架,该框架学到的特征可直接用于4种不同的跨人脸-语音匹配任务.首先,在双流深度网络顶端引入一种新的权重共享的多模态加权残差网络,以挖掘人脸和语音模态间的语义关联;接着,设计了一种融合多种样本对构造策略
其他文献
针对现有的基于对抗学习的领域适应算法未能充分挖掘样本的可转移特征导致泛化能力较差和分类精确度较低的问题,本文提出基于特征和类别对齐的领域适应(FCDA)算法.首先,针对最大均值差异(MMD)度量准则存在的不足,改进得到一种新的MID(Maximizes the Intra-domain Density)度量函数,分别度量具有相同标签的源域样本特征间的分布散度、相同标签的目标域样本特征间的分布散度,
期刊
对于大量的卫星和地面站资源,随着观测任务与日俱增,如何高效安排对应的一体化成像数传活动成为了提升卫星管控效能的关键。在综合考虑实际约束的基础上,文章建立了数学模型来详细描述成像卫星联合任务规划问题,通过采用统一资源编码的思想设计了一种简单且易于理解的个体表示方法,并利用任务有效执行期的潜在冲突关系提出了相互冲突任务集的概念来降低问题求解的时间复杂度,由此生成了相应的算法框架。最后运用多个测试实例验
期刊
为了克服经典协同稀疏解混算法的不足以及全变差正则项引起的边缘模糊问题,同时考虑到稀疏性和空间信息对解混精度提高的重要性,采用结合超像素和低秩的协同稀疏高光谱解混算法,进行了理论分析和实验验证。该算法对高光谱图像进行超像素分割,并对每个超像素施加协同稀疏性约束。此外使用低秩正则项代替传统的全变差正则项来利用空间信息,选取一组模拟数据和一组真实数据进行了实验。结果表明,模拟实验中信噪比为30dB时得到
期刊
为了解土壤有机碳矿化的研究进展和未来发展趋势,以Web of Science核心合集数据库中1045篇土壤有机碳矿化的研究论文为数据源,通过CiteSpace、VOS viewer和GIS分别以发文数量、总/平均被引频次等为指标,对国家、机构、作者等进行了分类与可视化展示。结果表明:1982—2020年间,土壤有机碳矿化研究的发文数量不断增长,尤其是1993—2019年。美国总发文量第一且中介中心
期刊
为解决基于LiDAR点云杆塔倾斜检测方法鲁棒性低、自动化程度差等问题,利用杆塔塔身各层在水准面上投影成标准矩形的结构特征,提出一种基于分层最小外接矩形与抗差估计的LiDAR点云杆塔倾斜检测方法。首先,利用每一层点云最小外接矩形的面积、比例变化过滤塔头、高低腿等非对称杆塔结构,将杆塔塔身各层点云最小外接矩形中心点作为中轴点;其次,利用最小外接矩形四边与点集的内切点高程值进行高差检验,在杆塔中轴线拟合
期刊
Due to its inherent characteristics of flexible mobility, unmanned aerial vehicle (UAV) is exploited as a cost-efficient mobile platform to assist remote data collection in 5th generation or beyond 5t
期刊
行人重识别目标是利用计算机视觉技术判断在多个摄像头下采集的图像序列或视频中是否存在特定的行人,其本质是跨境头行人检索问题。基于监督学习的行人重识别方法取得了显著的检索效果,然而难以解决行人重识别存在的跨域问题,即在一个数据集上训练的模型直接应用到其他数据集时,会出现准确率显著下降的情况。为解决这一问题,提出一种基于域自适应的无监督行人重识别算法。首先,为挖掘不同行人重识别数据集间潜在的特征关联,提
期刊
针对复杂情况下吸烟行为识别效果差以及数据样本缺少的问题,本文提出一种基于弱监督细粒度结构与EfficientDet网络的吸烟行为识别算法。算法采用弱监督细粒度两级注意力模型框架,首先采用结构化的方法检测出图像块的特征边缘,并利用非极大值抑制对边缘进行筛选,形成候选区域块;然后通过融合选择相关块形成特定物体的物体级筛选器以及定位判别性部件的局部级筛选器的结果来对吸烟行为进行有效的识别;其次,物体级筛
期刊
针对RGB-D相机与抓取机器人的本体之间的手眼标定问题,提出了基于目标检测的机器人手眼标定方法。本方法将3D打印球作为标靶球夹持在机械手末端,使用改进的yolov3网络实时定位标定球球心,计算机械手末端中心在相机坐标系下的3D位置;运用奇异值分解方法求解机器人坐标系与相机坐标系转换矩阵的最小二乘解。仿真实验结果表明,标定误差成正态分布,误差方差稳定。最后,在6自由度UR5机械臂和Intel Rea
期刊
地震灾害可能造成电气互联系统基础设施的严重损坏,导致停电停气事故。为评估和提升地震灾害下电气互联系统的能源供应能力,本文首先构建了计及地震空间分布和震级不确定性的电气互联系统元件失效概率模型;其次,提出了基于两阶段气网优化潮流模型的电气互联系统最优负荷削减算法,提升了收敛性和计算效率;在此基础上,建立了地震灾害下电气互联系统韧性评估及提升方法;最后,基于IEEE RTS 79电网和14节点气网,搭
期刊