基于云计算的跨媒体相关性分析

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:palerm97
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨媒体是在多媒体的基础上,模拟人脑管理和使用不同类型的多媒体数据。跨媒体的提出更加符合人脑对视觉、听觉等不同感官信息的综合处理模式。如何存储、检索和交换以不同媒体形式表达的相同或相关的跨媒体信息成为近年来的重要课题。不同类型的多媒体特征之间存在着关联信息。这些信息能在多媒体语义理解过程中有效地完成信息的互补和增强,并为各媒体之间的跨越提供了基础。跨媒体信息相关性研究致力于发现并有效地表示和利用多媒体对象之间的这种关联。  本文的研究瞄准“大数据”时代跨媒体海量信息处理,基于云计算技术,研究典型相关性分析的概率模型以及跨媒体海量信息相关性建模等方面的理论问题,并设计实现跨媒体相关性分析云引擎。取得的主要成果有:  1.典型相关性分析(CCA)是一种线性数学模型,不足以揭示真实世界中大量存在的非线性相关现象。本文采用局部化的方法,在概率典型相关性分析(PCCA)的基础上,使用概率混合模型框架,提出了混合概率典型相关性分析模型(MixPCCA)以及估计模型参数的两阶段EM算法,并给出了使用聚类融合确定局部线性模型数量的方法和MixPCCA模型应用于模式识别的理论框架。在USPS和MNIST手写体数据集上的实验证明,MixPCCA模型通过混合多个局部线性PCCA模型不仅提供了一种捕捉复杂的全局非线性相关性的解决方案,而且还具备检测只在局部区域才存在的相关性的能力。  2.针对弱匹配多模态数据的相关性建模问题,本文提出了一种弱匹配概率典型相关性分析模型(SemiPCCA)。SemiPCCA模型关注于各模态内部的全局结构,模型参数的估计受到了未匹配样本的影响,而未匹配样本则揭示了各模态样本空间的全局结构。在人工弱匹配多模态数据集上的实验表明, SemiPCCA可以有效克服传统CCA和PCCA在匹配样本不足的情况下出现的过拟合问题,取得了很好的效果。接着,本文提出了一种基于SemiPCCA的图像自动标注方法。该方法基于关联建模的思想,同时使用标注图像及其关键词和未标注图像学习视觉模态和文本模态之间的关联,从而能更准确地对未知图像进行标注。  3.将CCA引入迁移学习,结合基于特征映射迁移学习的思路,本文提出了一种跨领域典型相关性分析(Cross-Domain CCA,CD-CCA)算法。该算法在保持各领域特有特征与领域共享特征相关性的基础上,通过选择合适的基向量组合训练分类器,使降维后的相关特征在领域间具有相似的判别性。在20Newsgroup上144×6个分类问题以及多领域情感分析数据集上12个分类问题的实验结果表明,CD-CCA算法可以有效地提高跨领域迁移分类准确率。  4.对比分析了目前主流的云计算技术,并以Spark平台为基础实现高斯混合模型(GMM),概率主成份分析(PPCA),概率典型相关性分析(PCCA)以及本文中提出的混合概率典型相关性分析(MixPCCA)和弱匹配概率典型相关性分析SemiPCCA的EM算法并行化方案,设计实现了跨媒体相关性分析云引擎,为用户提供跨媒体的检索服务。
其他文献
该文的研究重点是两个:一个是对Sun Engine进行源码分析;另一个是采用类比的方法来研究网格系统,主要的目的就是把一个比较陌生的系统转化为一个相对熟悉的系统来分析.该文首
近年来,随着计算机应用领域的迅速扩大,计算机软、硬件技术的不断涌现,人们对软件质量提出了新的更高的要求,但是却没有很好的度量方法和度量工具.该文提出的面向对象软件质
漏洞扫描技术是网络安全技术的重要组成部分.然而,传统的漏洞扫描器存在功能单一、管理地域限制、不易跨系统操作等诸多缺陷.为了满足管理员对安全管理功能多样性、易扩展性
随着移动互联网、手持拍照智能设备、网络社交媒体的兴起和普及,人们得以随时随地制作、分享和获取数字图像数据。然而,急速增长的图像数据量给互联网有效管理带来严峻考验。据
随着信息技术和互联网技术的快速发展,各个学术系统的出现,为科研人员的研究工作带来了极大的便利。对于学术系统而言,如何能够提供高质量的信息服务是其非常重要的问题。学者相
该文利用视频对象运动的一致性,提出了一种视频对象分割和跟踪的方法.与通常的视频对象分割算法不同,该文中的方法利用对象运动的一致性来逐个估计图像中的运动,不同的运动对
该文主要讨论了对基于包过滤的个人防火墙的研究,并提出了系统的实现框架.该文首先提出了系统的体系结构设计,然后从基于VxD技术的数据过滤机制、Aho Corasick多关键字匹配算
图像分割是一种重要的图像分析技术。本文处理的对象是灰度图像,分割的核心是对像素进行聚类,属于优化问题。将Hopfield网络应用于求解优化问题,就是把目标函数转化为网络的能量
为了适应国防现代化的需要,提高中国主战坦克的综合作战效能,开发坦克电子综合化系统已经成为必然趋势.正是基于时代的要求,"坦克电子综合化系统项目"经过"八五"预研,"九五"
在分布式系统运行过程中,当某一主机不能正常运行时,系统仍能够继续运行.为了使系统具有可靠性,希望系统具有功能备份与重组的特征,该文在分析了目前的解决方案的基础上提出