【摘 要】
:
随着信息技术的快速发展与普及,急剧增长的图像、文本、音频、视频等来源广泛、形式多样的异构多模态数据充斥在互联网的各个角落。数量庞大的多模态数据中蕴含着丰富的社会
论文部分内容阅读
随着信息技术的快速发展与普及,急剧增长的图像、文本、音频、视频等来源广泛、形式多样的异构多模态数据充斥在互联网的各个角落。数量庞大的多模态数据中蕴含着丰富的社会价值与潜在的经济价值。如何在海量数据中进行准确的交叉检索逐渐成为社会各界关注的问题。然而由于多模态数据之间存在的异构差异性以及语义鸿沟等问题使得设计高效的交叉模态检索算法较为困难。鉴于基于哈希的算法具备的占用存储空间少、计算效率高等优势。近年来越来越多的学者使用基于哈希的算法解决交叉模态检索问题。现有基于哈希的交叉模态检索算法一般是将多模态数据映射到统一的潜在空间中,然后通过哈希函数对潜在特征进行量化得到哈希码。这些算法存在许多有待改进的地方。首先标签对特征表示与样本鉴别信息的学习有着重要作用,然而很多算法只是利用标签信息学习统一的哈希码,没能注意到标签信息对提高哈希函数的质量也有很大的帮助;再者,针对原始数据变换前后的特征损失问题,许多算法采用协同矩阵分解加以低秩约束等方式实现,类似的方式可能会导致大量的特征损失;除此之外,许多算法将特征提取过程与哈希函数学习过程彼此独立出来,这种形式学习到的哈希函数不能很好地保持原始数据的特征;最后,现存大多数交叉模态检索算法未充分考虑模态内以及模态间的相似性保留等问题,这将导致此类算法无法充分保持原始数据的局部特征。本文在深入学习协同矩阵分解、子空间学习、残差保持、邻域图构建的基础上,提出局部保持哈希交叉模态检索算法和和相似度保持哈希交叉检索算法。主要研究内容与贡献整理如下:在局部保持哈希交叉模态检索算法中,通过将相似性残差保持结合样本的局部相似性结构引入到特征变换过程中,很好的保持了原始数据在变换前后的特征一致性。此外算法也对原始数据变换之后的特征空间进行约束,进而更好的保持原始样本局部结构特征,提升哈希码的鉴别性。最后算法将哈希函数学习过程与特征提取过程相结合以提升哈希函数学习的质量。针对原始数据变换过程的特征损失以及学习高质量的哈希函数等问题,在局部保持交叉模态检索的基础上,进一步提出相似度保持哈希交叉检索算法。该算法在最小化特征变换前后残差值并结合原始数据的局部特征结构的同时,通过增加三重图约束结构保持原始数据模态内部以及模态间的相似性。针对标签信息,利用线性回归学习统一哈希码的同时将标签信息应用到哈希函数与局部特征学习上,以提升哈希码的相似性保留能力并增强哈希函数的适应性。在实验中,将本文提出的两种交叉检索算法应用到该领域被广泛使用的三个基准数据集上,并与最新;提出的相关交叉检索哈希算法进行实验对比与分析。结果表明,相比现有的交叉模态检索哈希算法,本文提出的局部保持交叉模态哈希与相似度保持哈希极大地提高了检索精度,表现出良好的检索性能。
其他文献
弱监督的细粒度图像识别仅使用图像级别标签来区分每个大类中不同的数百个子类。由于具有类内差异大类间差异小的特点,细粒度图像识别是一项极富挑战性的任务,目前主流方法主
互联网作为人们获取信息的主要途径,在给人们生活带来便利的同时,也使得人们不得不面临信息过载的问题。由于推荐系统能有效缓解信息过载,在互联网公司中应用非常广泛,其中,
《普通高中英语课程标准(2017年版)》提出了发展学生听、说、读、写、看等语言能力的要求与建议,并说明了高中英语写作教学应注重对学生策略能力的培养。本文基于认知过程的
Servi和Finn提出的工作休假策略是排队论研究的热点问题,它主要描述了这样一种情况:即服务员在休假期间虽然不会停止工作,但是服务的速率比较低。也就是说,在休假期间,系统仍留下部分服务员继续工作,其余服务员可以进行休假或者做其他工作。与经典休假排队相比,工作休假可以更有效地保证系统的运行,使得系统的损耗和负载尽可能降到最低,即在系统中,当主要工作相对较少时,可从事其他辅助工作。如果在工作休假期没
近年来,随着污水排放标准的逐渐提高,新型生物脱氮技术成为水环境处理领域研究热点。如何利用氨氧化菌(AOB)和亚硝酸盐氧化菌(NOB)的不同代谢特征,实现对NOB的抑制作用,完成生物处理系统内亚硝酸盐不同程度的积累,往往是新型生物脱氮工艺开发的核心问题。稳定实现生物处理系统的亚硝酸累积,受制于溶解氧(DO)、游离氨(FA)、温度(T)等因素,这些因素之间相互影响、相互制约。本研究利用序批式反应器(S
青少年是正处于学习时代的主要人群,当代在学生时代就已经接触智能终端的人群,在日常的社会生活中比较熟悉利用智能终端来进行学习、支付以及新消息的接收。比起成年人,青少
脱氧糖是一种重要的糖类化合物,在现代药物中经常出现它的身影。由于脱氧糖在医药领域有着巨大的潜力,它受到了人们的广泛关注。目前合成脱氧糖的主流方法都存在一些缺陷。因此寻找高效,绿色的合成脱氧糖的方法具有重要研究意义。本文以探索合成脱氧糖的新型方法为研究内容,主要研究结果如下:一、在本课题组之前的光照脱巯基反应基础上,对其改进得到了一种绿色,高效的合成方法。使用含硫乙酰基的糖苷作为反应原料,DMF作为
短文本分类是一种基于长度较短文本学习语义表征并用于分类的任务,其应用场景包括社交媒体上用户的实时评论,对于商品/作品的评价等,这些文本通常具有口语化的特点。目前,应
裂隙岩体的渗流是最常见的地下水流状态,在采矿、石油、水利、边坡、基础、地下工程中广泛存在。大量的工程实例表明,地下水渗流严重影响着工程稳定性,因此裂隙岩体渗流是各工程必须研究和解决的问题。由于裂隙分布复杂,裂隙岩体是一种非均质、不连续的各向异体,地下水在裂隙岩体中分布和渗流的不均匀性,导致裂隙岩体渗流问题研究极其复杂。因而对于实际工程而言研究裂隙岩体渗流问题具有十分重要的意义。论文结合鸿图嶂隧道工
基于亚波长结构的导模共振光栅滤波器具有高衍射效率、低旁带、带宽可控、参数敏感等理想特性,并且尺寸较小易于集成,是近几年前沿光通信器件领域的研究热点,能够推动未来光