基于深度哈希算法的图像—文本跨模态检索研究

来源 :北京交通大学 | 被引量 : 5次 | 上传用户：xiaoqingwa123456789

【摘要】

：

随着移动互联网的发展和智能手机、数码相机等设备的普及,互联网上的多媒体数据呈爆炸式增长。在信息检索领域,多媒体大数据的不断增长带来了跨模态检索应用需求。所谓跨模态

【作者】

：

姚伟娜

【出处】

：

北京交通大学

【发表日期】

：

2018年01期

【关键词】

：

跨模态检索深度学习哈希方法多标签学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着移动互联网的发展和智能手机、数码相机等设备的普及,互联网上的多媒体数据呈爆炸式增长。在信息检索领域,多媒体大数据的不断增长带来了跨模态检索应用需求。所谓跨模态检索,即查询和待检索数据模态是不同的,如查询数据为图像,待检索数据为文本或视频等。而目前主流的搜索引擎,如百度、谷歌、必应等,仅提供一种模态的检索结果,即以文本检索文本、以图像检索图像等。此外,随着深度学习在计算机视觉、自然语言处理等领域取得一系列突破性进展,将多媒体大数据与人工智能相结合,是两个领域未来共同的发展趋势。因此,结合新技术和新需求,探索新的跨模态检索模式成为当前信息检索领域亟待解决的挑战之一。本文主要关注图像和文本两种模态之间的相互检索。通过深入分析对比现有方法,发现哈希方法在解决大规模跨模态检索问题上具有存储效率高、检索速度快的优点。但当前大部分基于哈希方法的跨模态检索仍采用传统手工设计特征,并且在处理多标签数据时没有充分利用标签的语义信息,使得检索结果准确率不高。针对以上缺陷,本文提出一种基于多层语义的深度跨模态哈希方法(DeepMulti-level Semantic Hashing,DMSH),实现图像-文本跨模态检索的同时,解决了当前大部分跨模态检索方法在处理多标签数据上的不足,充分利用了深度学习在特征提取和表示上的优势,及哈希方法在数据存储和计算效率上的高效性。具体地,本文主要研究工作包括:(1)在回顾跨模态检索、深度学习、哈希学习等领域的发展历程基础上,深入分析了现有的基于深度哈希方法的跨模态检索的研究现状及存在的问题;(2)提出基于标签共现关系建立样本相似度矩阵的方法,解决了现有方法不能充分利用标签的语义信息,导致检索结果准确率不高的问题;(3)分析现有的深度哈希方法网络结构设计的特点,提出了一种整合特征提取和哈希码学习的统一框架。针对图像和文本数据各自的特点采用两个不同的深度神经网络分别提取图像和文本的语义特征,并在输出端通过标签语义关系建立关联,实现端到端学习;(4)在公开数据集MIRFlickr-25K上将DMSH与当前主流的跨模态哈希方法CCA、CMFH、STMH、SCM、SePH、DCMH进行充分的对比实验,对算法性能进行测评;(5)通过实验比较了 CNN-F、VGG-16、ResNet-50三种不同的卷积神经网络结构对检索结果的影响。实验表明,本文提出的DMSH方法在图像-文本跨模态检索任务上优于所对比的模型,并且在CNN-F网络上的检索结果优于VGG-16和ResNet-50。在此基础上,未来可在探索更好的融合标签语义信息的方法、挖掘更多语义信息、改进文本特征学习模块、改进网络结构以学习更好的特征表示等方面做进一步改进。

其他文献

男中音咏叹调《请你到窗前来吧》正谱演奏分析

莫扎特是古典主义时期欧洲歌剧的代表人物之一,《请到窗前来吧》便是其歌剧《唐璜》中的经典唱段,其中的正谱演奏在细节处理上有很大的研究价值。

期刊

唐璜正谱演奏声乐演唱

某型飞机空舰导弹供电系统检测仪的设计

为解决某型飞机战训任务前和飞机定检时空舰导弹供电系统故障无法检测和定位的难题,研制了空舰导弹供电系统检测仪。检测仪是一个基于CompactRIO平台和触摸屏式计算机TPC的实

期刊

空舰导弹供电系统检测仪设计

清代山西灾害应对及官民互动——以碑刻资料为中心

作为地方社会的主体成员,灾民的防灾自救主要包括神灵崇拜、村社联合抗灾、乡绅赈济、商人救灾等形式。它区别于国家荒政体系,但在特定条件下又与官员赈济和国家赈济相结合,

期刊

碑刻清代灾害应对

例谈家庭小实验在导入新课中的独特魅力

基于教材的分析研究提出问题，为了得到预期的鲜明的实验现象，使学生很好地感知金属钠的性质，完成三维教学目标，对《金属钠的性质与应用》中的三个课本实验进行了改进。在学生实践

期刊

课本实验改进方案实践反思

山西省十一个地级市经济竞争力分析

通过对山西省11个地级市的经济实力及产业结构的对比,分析各市的经济可持续发展能力的排名情况,可以发现各市经济发展的主要问题。山西提升城市经济竞争力应着力提高资源配置

期刊

山西地级市经济竞争力提升

Cr12MoV钢模具冲头焊修技术

主要介绍了Cr12MoV钢模具冲头崩损后采用焊条电弧焊技术进行修复的操作技术,阐述了针对崩损冲头缺损部位的焊修工艺,并应用到实际生产工作中,较好地解决了生产难题。

期刊

模具冲头崩损焊修焊条电弧焊焊后热处理

简析淅川下王岗晚二期文化和先商文化

淅川县位于河南省的西南部,北临西峡县,东接内乡县,南与湖北省均县和郧县毗邻,西与陕西省商南县接壤,境内群山环抱,丹江纵贯其间,土质肥沃,气候温和,适于人类生息繁衍,境内

期刊

先商文化二里头文化河南龙山文化

农村土地流转及农村土地承包合同管理研究——以宣威市板桥街道为例

建立合理的农村土地流转制度,加强农村土地承包合同管理,不仅能有效维护广大农民的利益,而且能促进农业生产发展,提高人们的生活水平,发展现代农业。但目前农村土地流转和农

期刊

农村土地流转土地承包合同

高职体育后进生成因及其转化教育

体育后进生是客观存在的一个特殊群体,他们在体育态度、技术、技能、身体素质、意志品质等方面与正常生差异明显。“体育后进生”由生理、心理、客观、主观多方面因素形成的

期刊

体育后进生体育教师体育教学转化对策

鹊巢鸠占——鸟类的巢寄生行为

每当春回大地,万物复苏,鸟儿们在经过千姿百态的求偶仪式之后,便开始了营巢和育雏的辛勤劳作.筑巢、孵卵和养育小鸟需要花费大量的精力.但是,一些善于投机取巧的鸟采取了一个

期刊

巢寄生

基于深度哈希算法的图像—文本跨模态检索研究

与本文相关的学术论文