跨媒体数据的语义分类与检索

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:ainyli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和社交网络的迅猛发展,数字图像、文本、音频、视频等跨媒体数据正在改变着人们的生活和工作方式。如何使计算机理解跨媒体数据的语义内容和分析跨媒体数据之间的关联,已经成为跨媒体和模式识别领域的重要研究课题。本文以跨媒体数据为研究对象,针对跨媒体语义增强、跨媒体检索和多标签属性学习等关键问题开展了深入的研究工作,论文的主要创新性研究成果包括:  1.提出一种跨媒体语义增强框架,并应用于基于内容的图像检索。跨媒体语义增强的目标是通过利用视觉特征和文本特征之间的对应关系,寻求一种有效的映射机制。基于这种映射,视觉特征的杂乱分布特性可以通过具有显著判别分布特性的文本特征进行改善。实验结果表明该方法可以有效地提升图像检索任务的性能。  2.提出一种任务驱动的跨媒体检索算法(Task-specific Cross-media Retrieval,简称TSCR)。TSCR通过联合优化成对图像和文本之间的相关性以及某种模态(文本或图像)特征向其对应语义空间的线性回归,从而获得两组将文本和图像原始特征投影到同构空间中的映射矩阵,分别用于图像检索文本和文本检索图像。实验结果验证了TSCR算法的有效性。  3.提出一种深度语义匹配(deep Semantic Matching,简称deep-SM)算法用来解决跨媒体检索问题。deep-SM通过两种不同的深度神经网络将图像和文本映射到同构的语义空间中,进而实现两种模态数据之间的跨媒体检索。同时对比分析深度卷积神经网络(Convolutional Neural Network,简称CNN)的视觉特征对跨媒体检索的影响。实验结果验证了deep-SM算法和CNN视觉特征对跨媒体检索的有效性。  4.提出一种HCP(Hypotheses-CNN-Pooling)深度学习框架用于解决多标签属性分类问题。HCP利用一种似物性推荐框(Hypotheses)筛选方法对每张多标签图片选取了少量具有代表性的Hypotheses,并通过共享的CNN和跨Hypotheses的池化(Pooling)策略构建了一个有效的多标签预测框架。HCP通过端到端的方式进行训练并在Pascal VOC2007和VOC2012两个数据集上获得了国际领先的分类性能。
其他文献
织物起毛起球不仅会严重影响织物的外观,而且会降低织物的穿着舒适度,因此评价织物起毛起球性能成为纺织品检验领域内的一项重要内容。标准样照对比法是目前常用的起毛起球等
LTE-Advanced无线通信系统以其优越的性能获得了广泛的关注,该系统性能的发挥离不开充足的无线频谱资源的支持,随着无线通信系统的飞速发展,可用的无线资源愈发稀缺,在连续频段上
随着3G网络的普及,分组传送网络已经逐渐代替了传统的SDH网。然而现阶段的网络既要支持分组传送网络又要兼容传统的SDH网,这就需要开发出基于多网融合的网络管理系统,提供友好的
随着电磁环境的不断恶化,射频干扰已经成为提高微波辐射计探测精度的最大障碍,开展射频干扰检测研究具有重要意义。针对辐射计射频干扰检测需求,本文研究了基于时频域的射频干扰检测算法,设计并实现了辐射计射频干扰时频域检测系统,并对系统进行了实验验证。首先,本文对辐射计射频干扰时频域检测方法进行了研究。在介绍了峰度检测算法和能量检测算法的基础上,分析了峰度检测在恒虚警下对不同信噪比和占空比射频干扰的检测性能
移动互联网和物联网市场与业务应用的迅猛发展,推动了第五代移动通信(5G)的技术研究。5G要求具有媲美光纤的接入速率、享受本地操作的实时体验以及随时随地的宽带无线接入能
城市交通拥堵是世界各国面临的主要城市问题。随着我国国民经济的高速增长,城市化水平空前加快,机动车保有量逐年增多,导致许多城市都出现了不同程度的交通拥堵状况,虽然目前
移动通信网络从最初的第一代模拟蜂窝系统发展到第四代,小区半径一直在不断地缩小,小区密度在不断地增加。这种小区密集化机制已经为移动通信网络容量带来了一千倍的增益。在
语言合成是用人工的方式产生人类语音从而赋予计算机如人一般自如说话的能力,目前的语音合成研究大多集中在文语转换(Text-To-Speech, TTS)这一阶段,即将一般语言的文字转换
人机交互技术是连接人与计算机或其他电子设备的桥梁。近几年来,随着科学技术的快速发展,人机交互技术也因此取得了更大的发展,不断的向更自然、更和谐、更便利的方向发展。
地物光谱由于目标及其环境的复杂性、成像环境的多变性、传感器性能的局限性等多种因素,使其获取的光谱往往呈现为混合光谱。混合光谱的存在大大限制了光学遥感应用的幅度和深度,因此,混合光谱的解混及其应用成为近年来遥感领域的重要研究课题之一。目前已有针对混合光谱的研究大多是依从图像的空间特性而展开的,并不能体现混合光谱的物理机理,并且往往局限于目标与环境平面空间内相邻的光谱混合,对于目标与环境上下分布的混合