视觉语义理解关键技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:q158743153
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络技术飞速发展,特别是公共安全监控系统和网络视频分享平台的普及,视觉数据呈现出爆炸性增长。在大数据时代,如何对视觉信息中包含的复杂语义进行自动解析,实现从独立的语义概念识别到类人的自然语言描述生成,是当前计算机视觉和人工智能领域的研究热点,对于公共安全风险防范、网络文化市场监管等多个领域具有重要的应用价值。视觉语义理解以图像/视频为数据载体,领域知识为核心,其目标是对视觉信息中的目标、行为、场景等不同类型的语义概念进行识别,并进一步生成类人的自然语言描述,从而实现视觉模态到文本模态的映射,跨越视觉语义鸿沟。本文在对视觉语义理解领域研究现状进行详实调研和深入分析的基础上,提出了一套创新的视觉语义理解理论体系,并针对三个核心科学问题开展相关研究:1)在视觉语义概念识别层面,针对视觉模式相近的语义识别困难问题,面向多语义之间的潜在关联性进行建模,从而构建数据与知识相互驱动体系,通过视觉到语义以及语义到语义双重关联性建模,实现复杂语义概念识别;2)在视觉类人解析层面,针对视觉自然语言描述生成模型构建中的多模态数据耦合问题,从分析和发掘不同模态之间互补性和融合方式出发,设计相应深度序列生成模型网络结构和优化算法,从而将视觉内容自动解析成符合人类认知的自然语言描述;3)针对前述数据驱动的视觉解析模型缺乏评价准则引导问题,构建基于客观评价准则的反馈机制,将视觉解析模型和基于客观评价准则的评价模型进行联合学习,实现视觉解析模型在客观评价准则引导下进行迭代优化。针对上述理论体系,本文对各个关键科学问题展开相关研究,主要贡献总结如下:1.本文提出一种基于语义潜在关联性的视觉语义概念建模方法。首先,提出了基于稀疏迁移学习的多域共嵌子空间学习方法。然后,基于多任务学习理论,将多域融合的特征学习与多语义概念建模进行联合学习。通过相应目标函数的构建实现语义潜在关联性引导的多语义模型学习。研究中,针对多视角、多模态环境下的多类人体动作识别问题进行实验分析,验证了所提方法的有效性。2.本文针对视觉类人解析中的多模态数据耦合问题,主要研究了不同模态数据之间的潜在关联、序列数据的层级化注意力机制以及模态变化的异步性等问题,并构建相应深度学习网络进行模型学习,从多角度实现了多模态数据融合,通过多模态的互补性挖掘实现视觉自然语言描述的生成。3.本文针对数据驱动的视觉解析模型缺乏评价准则引导问题,提出基于强化学习的视觉类人解析框架,实现了多层级奖惩机制引导的多层级策略网络优化。该框架可嵌入当前代表性视觉解析网络、生成语句的评测指标以及视觉与语义相关函数,因此具有很强的扩展性和灵活性。在此基础上,通过多类视觉解析网络和客观评价指标的对比,验证了方法可行性。
其他文献
本文讨论革命洪流中的聂绀弩(1903-1986)以及他的文学活动。本文共四章。第一章讨论聂绀弩和革命组织之间冲突。聂绀弩参加革命,有一定的被动性。他在国民革命时期加入国民党
全国城市污泥产量逐年递增,污泥的高含水率严重制约着污泥的后续利用。以降低污泥含水率为目标的污泥深度脱水技术已成为国内外污泥处置领域的研究热点。起源于微生物湿法冶
小麦白粉病是由小麦白粉病菌(Blurmeria graminis f.sp.tritici,Bgt)引发的真菌性病害,是世界上许多国家小麦生产中危害日趋严重的病害之一。抗白粉病基因Pm21来自小麦近源物
本文总结了多参量光纤传感网研究现状,针对多参量光纤传感网组网结构简单、数据并发采集和处理能力弱、波长解调精度低等不足和缺点,分别提出了一种多路复用的多参量异构光纤
沿空掘巷在煤炭开采中广泛采用,小煤柱将巷道与采空区隔离,防止采空区水与有害气体串入巷道。采空区积水条件下,虽水压较低,但会造成煤柱承载能力降低、变形加剧甚至破坏,且
胶北地块位于华北克拉通东部陆块,胶-辽-吉活动带的南段,是前寒武纪重要核心地体。TTG片麻岩中以捕虏体形式产出的高压基性麻粒岩和空间位置与之密切相关的高压长英质麻粒岩
锂离子电池已经被广泛应用于移动电子、电动汽车等领域。随着清洁能源的开发和利用进程的推进,对电池提出了更高的要求,如更长的充放电寿命、更高的能量密度、更低的成本等。
作为国家的一种软实力,国家认同能把整个国家共同体中的单个个体团结起来,对于维系多民族国家的统一,保障多民族国家的稳定,促进国家的繁荣昌盛具有极其重要的作用。1949年10
开发海洋装备关键部件用耐磨耐蚀材料是保障海洋装备安全可靠运行的关键。高熵合金(High-entropy Alloys,简称HEAs)涂层具有优良的耐磨耐蚀性,是极具发展潜力的海洋装备材料
水流泥沙的耦合运动决定河流、海岸的演变以及工程结构物周围的地形冲淤变化,因此水沙耦合运动研究具有重要的工程意义。随着并行能力的提升和并行计算技术的发展,基于离散颗