跨模态数据分析与应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：zhanranran

【摘要】

：

随着互联网进入Web2.0时代，以微博、Flickr、Youtube等为代表的网站已逐渐成为新兴的各种数据产生和共享的平台。伴随而来的是文本、图像、视频和音频等信息的迅速膨胀。在网

【作者】

：

王开业

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

跨模态检索数据分析子空间学习法耦合特征选择哈希法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网进入Web2.0时代，以微博、Flickr、Youtube等为代表的网站已逐渐成为新兴的各种数据产生和共享的平台。伴随而来的是文本、图像、视频和音频等信息的迅速膨胀。在网络中，这些不同类型的数据往往会同时出现，用来表达相同的语义。例如维基百科中的特色文章是通过文本和图像共同表达的，这些信息之间存在互补性和相关性。随着不同类型数据的爆炸式增长，如何对这些不同类型的数据进行“跨模态数据分析”以便更加有效地利用这些数据成为亟待解决的问题。针对这一问题，本文提出了几种跨模态数据分析方法，并将其应用于跨模态检索。本文研究的主要内容如下:　　1、跨模态检索的难点是如何度量不同模态数据之间的相似度。为了解决这一问题，提出了一种联合图规则化的多模态子空间学习方法。该方法通过一个联合图规则项利用模态间的相似度和模态内的相似度来建模不同模态数据之间的相关性和每个模态数据内的局部邻域结构。为了得到一个更有区分力的子空间，学习多模态子空间的时候，最大化不同类数据之间的协方差矩阵（每一类包含多个模态的数据），最小化同类数据之间的协方差矩阵。实验结果表明了该方法的有效性。　　2、由于数据的底层特征一般都存在冗余和不相关的特征，所以如何在不同模态数据上同时进行特征选择（耦合特征选择）是一个非常重要的问题。为了解决这个问题，提出了一种双空间学习方法，该方法同时进行子空间学习和耦合特征选择。该方法对于每个模态的数据学习一个映射矩阵，把不同模态的数据映射到一个共同的空间中，在这个空间中可以进行不同模态数据之间的相似性度量。在学习映射的过程中，通过对映射矩阵进行l21范数的约束，来对不同模态的数据进行耦合特征选择，选择出那些相关的、具有区分力的特征。同时，对映射后的数据进行低秩约束来进一步加强不同模态数据之间的相关性。为了求解该问题的目标函数，提出了一种基于半二次最小化的迭代求解算法。实验结果表明该方法能取得更好的检索性能。　　3、为了在子空间学习的同时，保持不同模态数据之间的相似性关系，提出了一种联合学习方法。该方法的目标函数有三项构成，第一项是耦合线性回归项，目的是学习从不同模态数据的特征空间到共同空间的映射;第二项是l21范数项，目的是选择出不同模态数据中那些相关的和具有区分力的特征;第三项是多模态图规则项，用于保持不同模态数据之间的两种相似性关系:模态间数据的相似性关系和模态内数据的相似性关系。为了求解这一目标函数，提出了一种迭代求解算法，同时证明了算法的收敛性。三个跨模态数据库上的实验结果表明了该算法的有效性。　　4、不同模态的数据从不同的方面反映了事物的高层语义，由于不同模态数据的底层特征一般具有异构的特点，存在异构鸿沟。为了弥补不同模态数据之间的异构鸿沟，提出了一种基于联合字典学习的多模态数据统一表示学习方法。该方法通过联合字典学习，对于每个模态的数据学习一个字典，而对于表示同一语义的不同模态的数据，学习统一的表示来弥补不同模态数据之间的异构鸿沟。为了使模型鲁棒，对多模态数据的统一表示使用了l1-范数进行约束，以保证其稀疏性。同时将不同模态数据之间的相似性和不相似性关系通过约束项来约束字典和统一表示的学习。为了求解模型的目标函数，提出了一种迭代求解算法。实验结果验证了该算法的有效性。　　5、为了解决大规模的跨模态数据检索问题，提出了一种两阶段跨模态哈希方法。该方法将跨模态哈希问题转换成两个阶段来解决:哈希编码生成和哈希函数学习。在哈希编码生成阶段，根据模态间的相似性关系和模态内的相似性关系，把不同模态的数据放到一个多模态联合图中。如果两个数据之间存在相似性关系，则它们应该有尽可能相近的哈希编码。根据这一原则，设计了一个目标函数来求解多模态数据的哈希编码。然后，把哈希函数的学习看成是一系列二分类问题，通过对二分类问题的优化来求解每个模态数据的哈希函数。实验结果表明该算法有效提升了检索的性能。

其他文献

交联社会经济系统的非线性动态研究

交联振荡器系统的相锁和停振等现象的研究已有十多年的历史.该文从交联振荡器系统理论出发,从数学上发展了已有的交联振荡器的单向交联、多重交联等理论,系统地研究了连通交

学位

交联经济系统相锁稳态增长同步增长同步控制

面向物料管理的数据仓库的研究

论文的主要研究方向是充分利用现有MIS管理系统和已投运的软硬件设备,创建面向物料管理的数据仓库,并给出该数据仓库的OLAP(在线分析处理)应用设计与实现.首先,论文阐述了物

学位

数据仓库数据库物料管理

基于遗传算法的非线性系统辨识

该文研究了基于遗传算法的非线性系统辨识.首先,描述了遗传算法的基本原理和应用,以及该文用到的改进遗传算法.其次,讨论了非线性系统辨识方法和它的发展现状.然后,给出了应

学位

遗传算法双线性系统非线性最小二乘法系统辨识Cobb-Douglas生产函数模型

物资库存系统的控制优化与管理研究

该文是以上海梅山集团公司物资库存管理与控制为背景,根据梅山的具体情况,将传统与现代库存管理思想和方法相结合,研究制定库存控制优化方法.重点对以下思想进行拓展运用:市

学位

物资库存管理物资库存控制控制优化库存模型

线性时延控制系统的一些理论及应用研究

该文的主要目的就是针对线性时延系统,设计控制效果较好、鲁棒性较强的控制器.为了深入地研究线性时延系统,首先从理论角度出发,研究了不同情形下线性定常时延系统的稳定性判

学位

时延控制系统鲁棒稳定间隙PID控制神经网络预测控制

跨摄像机行人识别与轨迹挖掘

近年来视频监控在安防领域得到了广泛应用，与之紧密相关的智能视频分析技术的研究成果也大量出现。然而现有的大多数研究都集中在单一摄像机领域。虽然利用多摄像机获取大范围

学位

监控场景跨摄像机行人识别特征设计轨迹挖掘

基于粗糙集理论的数据采掘研究框架RSDM-Frame

数据采掘是从数据中识别方法的、新颖的、有潜在价值的、以及最终的可理解的模式的非平凡的过程.粗糙集理论可以直接从给定问题的数据对象集合出发,以上近似、下近似等近似集

学位

粗糙集数据采掘神经网络遗传算法决策支持

模糊数学在科技期刊质量管理中应用的研究

该文从宏观和微观两个角度对学术类科技期刊的质量管理总是进行了讨论:宏观上各个部门在对全国的科技期刊进行评比时存在着如何使评比更客观反映各个科技期刊的真实水平的问

学位

科技期刊质量管理审稿模糊综合评判期刊评比

高速公路智能化监控及专家系统的研究

高速公路智能控制涉及到多门学科,特别是随着电子技术、计算机技术、通讯技术的飞速发展,高速公路智能控制系统的研制从设计思想、实现手段、性能要求等方面已不同于传统的设

学位

高速公路智能控制高速公路信息系统优化管理交通控制高速公路智能监控专家系统优化控制

LGCIMS下的统计研究

该文所论述的LGCIMS作为CIM先进哲理在涟源钢铁集团有限公司的一个具体实现,充分体现了其利用计算机通信信息集成实现现代化生产制造的内涵.它的应用工程主体框架由成本信息

学位

CIMCIMSORACLE数据库一级统计粗集理论PowerBuilder编程

跨模态数据分析与应用研究

与本文相关的学术论文