基于深度学习的多模态检索研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:liongliong543
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代下,随着互联网技术的发展以及信息传输速率的加快,海量的数据等待着挖掘,数据的种类不断增多,因此,在海量数据中通过某种模态数据去检索其他种类的模态数据是这个大数据时代需要解决的问题,而基于深度学习的跨模态检索技术是目前最先进的技术,但是目前的跨模态检索技术训练时间较长,寻优能力和收敛能力通常不能兼顾。本文在MS-COCO数据集和Flickr30K数据集的基础上进行实验,通过使用深度卷积网络和深度循环网络分别对图片数据和文本数据进行抽象学习,直接得到各模态数据的高级语义特征,对得到的高级语义特征进行优化嵌入后,得到一个欧几里得空间,空间上的距离对应着多模态数据之间的相似度,使用三重挖掘方法生成的匹配/不匹配方法和反向传播方法,让对应的多模态数据在学得的空间上更紧凑。本文的主要研究内容包括以下几个方面:(1)本文提出了一种基于周期性权重变化的嵌入网络。在基于匹配对和非匹配对的三元组挖掘方法上,引入周期性权重变化,得到小批量的异类样本对和距离最短的异类样本对组成的损失函数,由于权重在合理的有界值之间循环变换,在不增加额外训练成本的前提下,提升了准确率,减缓了敏感噪声。(2)本文提出了一种基于聚类的新的网络训练方法。根据同类数据节点在嵌入空间上聚集,异类数据节点在空间上远离的特点,提出单分支网络优先训练方法,在单分支网络训练完成后,固定该分支网络的参数,通过双向检索目标损失函数对另一个分支网络进行训练,由于提前减缓了训练数据的噪声,因此训练时间更短,训练效果更稳定。对以上的研究内容进行实验,基于周期性权重变化的组合模型和基于文本聚类的分支网络优先训练方法均比目前的先进的VSE++和Embedding Net算法的性能要好。
其他文献
高光谱图像携带大量的空间和光谱信息,为人们研究地表物体的特性、进行地物识别创造了条件,使其在多个领域受到广泛的应用和关注。然而,高光谱遥感数据在获取过程中受到各种
铆钉作为一类紧固件,常用于航空航天、飞机装配等重要领域中,因此保证铆钉良好的质量尤为重要。目前,基于机器视觉的缺陷检测方法需要人为设计特征提取器对缺陷的特征信息进
随着俄罗斯社会政治经济近年来的逐渐回暖,各国的投资者也开始对俄罗斯的投资环境逐渐转向积极角度,评价日趋正面,对俄罗斯投资的积极性也变得越来越高涨。对中国自1978年改革开放以后对俄罗斯的投资分析可以看出中国对俄罗斯投资的规模变化、发展趋势以及给俄罗斯当地所带来的就业效应。自苏联解体后,俄罗斯的经济呈现逐年倒退趋势,越来越多的俄罗斯人民因为国家经济萧条而失业。为了恢复本国的经济发展,俄罗斯政府出台了
聚类分析是一种无监督的机器学习方法,可以在没有规则库的情况下,通过未标识数据集建立异常检测模型,因此在异常检测领域占有重要地位。模糊c-均值聚类算法_处(fuzzy C-means
强化学习被广泛应用于解决序列决策任务。然而,强化学习算法的样本利用效率较低,并需要很长时间来学习合适的策略,特别是当多个智能体在没有先验知识的情况下开始学习。该问
王时敏与髡残在源远流长的中国绘画史上都占有一席之地,并且二人同处在社会动荡,国家易主的特殊社会时期,但二人不论是在绘画理论还是笔墨语言等方面都有诸多的不同之处:一个是在清初画坛引领“正统画派”的领导式人物;一个是沉浸在自我世界中“疯狂”的画僧;一个在乱世中曲意迎合,稳中求全;一个遁入禅门,隐居避世。一个广纳门徒,使其创立的画派一直繁衍传承;一个只求抒发胸中意气,不求功与名。王时敏与髡残在乱世之下的
随着深度学习的不断发展,深度学习已经在图像、语音、自然语言处理、大数据特征提取等方面获得广泛的应用。越来越多的领域在融入深度学习技术之后,使得原本比较难处理的任务
“互联网+”的发展使得企业创新生态系统的内外部环境发生巨大变化,催生出多样化的价值共创模式,对于企业创新生态系统价值共创模式的研究有助于企业转变价值创造思维,更好地
计算机自适应测验(CAT)选题在实际应用中不仅需要考虑统计优化问题而且需要满足非统计约束。统计优化指测验要保证有较高的测量精度,而非统计约束指测验的组成满足一定的测验规范,如内容约束、题型约束、维度约束以及项目曝光控制等。同传统CAT一样,满足非统计约束也是多级评分多维CAT应用中需要解决的重要问题。多维计算机化自适应测验(MCAT),不仅可以获取被试在多个维度上的能力和特质信息,还可以提高测验的
随着物联网时代的到来,海量数据对网络的带宽、计算吞吐量带来严重负担,同时对计算与通信有苛刻的实时性要求,而传统的云计算方法无法解决这一瓶颈。为缓解这一问题,欧洲电信