基于跨模态哈希的图文检索研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:weizai111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息爆炸式增长导致信息呈现规模大、模态多、特征维度高的特点,这些特点对信息处理带来新的挑战。在信息检索领域,寻找样本的最近邻是核心工作。然而,由于数据这些新特点导致最近邻检索出现计算复杂度高、存储量大的问题。哈希技术由于其存储量低、检索速度快的优点,受到越来越多的重视。同时多媒体数据呈现多源异构特点,跨模态检索方法也成为热门研究课题。最近越来越多的跨模态哈希方法涌现出来。然而它们主要存在几个问题:(1)算法训练复杂度高。主要原因有:一方面,模型训练需要学习各个模态的哈希函数,使得迭代优化更加困难。另一方面,单个模态内部获得理想的哈希函数也需要消耗大量计算资源。(2)忽视哈希量化损失。常见的算法主要将异构的多媒体数据映射到一个共同连续低维子空间,然后量化处理获得哈希码。由于哈希码的离散特点,该问题是一个整数规划问题,直接将哈希码离散约束条件放松的优化方法会带来较大的量化损失,进而影响检索准确率。(3)算法数据库适应能力差。常见的跨模态哈希算法对单标签、多标签、大规模数据库和高维度数据库中的一种或者几种性能良好。但很少有算法能适应各种数据库。针对以上问题,本文以图文检索为例研究跨模态哈希算法的模型设计和优化方法,具体工作如下:(1)针对训练复杂度高的问题,本文提出一种简洁而有效的跨模态哈希算法。该算法首先利用单模态哈希算法从样本的一个模态中获得理想统一哈希码,然后应用线性回归获得其他模态的哈希函数。显然这个非迭代的方法能极大降低计算复杂度。(2)针对哈希量化损失,本文提出离散跨模态哈希方法。该方法通过每次求解一个维度的哈希码直接学习获得离散的哈希码。通过重构语义相似矩阵设计跨模态哈希函数。同时利用监督信息对获得的哈希码进行分类。(3)验证优化方法对结果的影响。跨模态哈希函数的设计非常重要,然而越来越多的论文证明对同一个问题使用不同优化方法,也会极大影响检索效果。因此本文进一步研究传统放松离散约束条件的优化方法和(2)中提到离散优化方法的差别。
其他文献
模型预测控制(Model Predictive Control,MPC)是先进控制技术的典型代表。随着MPC在实际工业中的广泛应用,企业对它的性能要求也越来越高。近年来,MPC性能监控技术成为预测控
计算机断层成像(Computed Tomography,CT)技术的诞生对于医学上的诊断有着划时代的意义。在医学成像中,为了患者健康有时需要减少x射线的照射,特别是对脑部组织的照射,如此只
反馈移位寄存器包括线性反馈移位寄存器和非线性反馈移位寄存器,是设计流密码密钥流生成器的重要工具.在eSTREAM项目中胜出的Grain算法采用非线性反馈移位寄存器和线性反馈移
伴随当今移动通信技术的快速发展,智能通信设备的体积日趋紧凑化,设备处理信息的能力也日趋多频化和宽带化。天线作为系统发射电磁波与接收电磁波的关键设备,是通信系统的重
It?型随机马尔科夫跳变系统在马尔科夫跳变系统中考虑了随机干扰对系统状态的影响,已经成为马尔科夫跳变系统研究的热点。目前已有许多关于It?型随机马尔科夫跳变系统的研究
将网络融入到传统控制系统而衍生出的网络控制系统在工业应用中有着不可替代的地位。因此,目前针对网络控制系统的建模、分析及相关设计问题的研究得到广泛关注。时变时滞和
集成成像是一种具有全视差、全色彩、连续视点的三维成像技术,而且成像结构简单,无需相干光源等严格要求。这使得三维集成成像技术被认为是未来前景最好的三维成像技术。然而
作为新型的工业通讯网络技术,工业实时以太网在工业自动化领域的应用越来越广泛,在分析了工业实时以太网的研究现状后,本文选择了在高速运动控制领域占据着重要的地位Sercos
如今,互联网的发展更加移动化、移动产品更加智能化,用户可通过移动智能设备获取海量的数据信息,这些数据蕴含着移动用户的兴趣偏好、行为轨迹等信息,具有很大的应用开发价值
工作流技术是政府和企业实现办公自动化的一项重要的技术手段。工作流技术提供了流程的定义、控制、监控、访问权限控制等功能,以实现业务流程的规范化、提高办公效率。目前,