跨模态学习相关硕士博士期刊学术论文

跨模态学习相关论文

跨模态视频片段定位方法研究

视频是信息社会中人们记录和反映现实生活的重要信息载体,包含丰富的语义信息。利用多媒体技术从包含多个场景活动的视频中定位出......

学位

视觉与语言视觉与音频视频片段定位视频理解跨模态学习

基于跨模态实体信息融合的神经机器翻译方法

现有多模态机器翻译（Multi-modal machine translation, MMT）方法将图片与待翻译文本进行句子级别的语义融合.这些方法存在视觉信息......

期刊

实体重构跨模态学习多任务学习多模态机器翻译

音视频跨模态声源分离研究

声源分离任务是音频领域相对古老的任务之一,最初提出时,被赋予“鸡尾酒会问题”这个优雅的名字。该问题最初旨在解决复杂场景下人......

学位

声源分离音视频声源分离跨模态学习自监督目标检测

基于毫米波雷达的人员定位算法研究

毫米波雷达定位技术基于人体反射的信号回波实现人员的位置估计。由于毫米波信号具有较强的环境适应力和一定的穿透能力,测距精度......

学位

毫米波雷达人员定位跨模态学习轨迹预测 Transformer

面向视觉语义理解的跨模态特征增强研究

细粒度图像分类是计算机视觉中一个长期存在的基本问题,并支撑着现实世界的各种应用。细粒度图像分类的任务是识别子类别的视觉对......

学位

特征增强跨模态学习可解释性模型细粒度图像分类

零样本图学习综述

深度学习方法的提出使得机器学习研究领域得到了巨大突破,但是却需要大量的人工标注数据来辅助完成.在实际问题中,受限于人力成本,......

期刊

零样本学习图学习跨模态学习属性词向量流形对齐深度学习图像识别

基于深度学习和标签语义关联的遥感影像多标签分类

随着高分辨光学遥感影像的发展,海量优质的遥感数据为地物观测提供了良好的条件。遥感影像多标签分类能够自动解译图像信息,快速批......

学位

光学遥感影像多标签分类图卷积神经网络跨模态学习

跨模态哈希学习算法及其应用研究

随着网络信息技术的发展,全球已经迈入了多媒体大数据时代。数据信息通常关联图像、文本、视频、音频等多种模态形式,多种模态数据......

学位

跨模态学习哈希学习图嵌入线上哈希学习半配对哈希

基于跨模态深度度量学习的甲骨文字识别

甲骨文字图像可以分为拓片甲骨文字与临摹甲骨文字两类.拓片甲骨文字图像是从龟甲、兽骨等载体上获取的原始拓片图像,临摹甲骨文字......

期刊

甲骨文字识别深度度量学习最近邻分类跨模态学习

服装推荐相关技术研究

伴随着电子商务平台的蓬勃发展,越来越多的人热衷于网络购物,其中,服装购买是在线购物中占比最大的部分,但是商城中服装种类繁多,......

学位

服装推荐属性识别跨模态学习搭配推荐

基于语音与人脸参数化表示的跨模态稠密深度网络学习方法

为了提高跨模态人脸表示与合成的性能,针对语音与人脸图像2种模态数据,提出一种基于人脸参数化表示与稠密深度网络相结合的面部生......

期刊

跨模态学习深度学习卷积神经网络参数化表示语音图像 cross-modal learningdeep leaningconvolutional neur

跨模态社交图像聚类

社交图像包含两种模态的信息：视觉信息和社交标签信息.绝大部分跨模态学习领域的研究者,将其精力集中在多模态信息的共享特征空间学......

期刊

跨模态学习共轭词典学习 WordNet 图像聚类社交图像语义相似度度量

分类重构堆栈生成对抗网络的文本生成图像模型

利用堆栈生成对抗网络,提出分类重构堆栈生成对抗网络.第一阶段生成64px×64px的图像,第二阶段生成256px×256px的图像.在......

期刊

文本生成图像堆栈生成对抗网络分类重构跨模态学习

看过本文同时还关注