视觉语义理解关键技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：q158743153

【摘要】

：

近年来,随着网络技术飞速发展,特别是公共安全监控系统和网络视频分享平台的普及,视觉数据呈现出爆炸性增长。在大数据时代,如何对视觉信息中包含的复杂语义进行自动解析,实

【作者】

：

徐宁

【出处】

：

天津大学

【发表日期】

：

2019年01期

【关键词】

：

视觉语义理解视觉语义概念识别视觉类人解析多任务学习多模态融合深度序列生成模型深度强化学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着网络技术飞速发展,特别是公共安全监控系统和网络视频分享平台的普及,视觉数据呈现出爆炸性增长。在大数据时代,如何对视觉信息中包含的复杂语义进行自动解析,实现从独立的语义概念识别到类人的自然语言描述生成,是当前计算机视觉和人工智能领域的研究热点,对于公共安全风险防范、网络文化市场监管等多个领域具有重要的应用价值。视觉语义理解以图像/视频为数据载体,领域知识为核心,其目标是对视觉信息中的目标、行为、场景等不同类型的语义概念进行识别,并进一步生成类人的自然语言描述,从而实现视觉模态到文本模态的映射,跨越视觉语义鸿沟。本文在对视觉语义理解领域研究现状进行详实调研和深入分析的基础上,提出了一套创新的视觉语义理解理论体系,并针对三个核心科学问题开展相关研究:1)在视觉语义概念识别层面,针对视觉模式相近的语义识别困难问题,面向多语义之间的潜在关联性进行建模,从而构建数据与知识相互驱动体系,通过视觉到语义以及语义到语义双重关联性建模,实现复杂语义概念识别;2)在视觉类人解析层面,针对视觉自然语言描述生成模型构建中的多模态数据耦合问题,从分析和发掘不同模态之间互补性和融合方式出发,设计相应深度序列生成模型网络结构和优化算法,从而将视觉内容自动解析成符合人类认知的自然语言描述;3)针对前述数据驱动的视觉解析模型缺乏评价准则引导问题,构建基于客观评价准则的反馈机制,将视觉解析模型和基于客观评价准则的评价模型进行联合学习,实现视觉解析模型在客观评价准则引导下进行迭代优化。针对上述理论体系,本文对各个关键科学问题展开相关研究,主要贡献总结如下:1.本文提出一种基于语义潜在关联性的视觉语义概念建模方法。首先,提出了基于稀疏迁移学习的多域共嵌子空间学习方法。然后,基于多任务学习理论,将多域融合的特征学习与多语义概念建模进行联合学习。通过相应目标函数的构建实现语义潜在关联性引导的多语义模型学习。研究中,针对多视角、多模态环境下的多类人体动作识别问题进行实验分析,验证了所提方法的有效性。2.本文针对视觉类人解析中的多模态数据耦合问题,主要研究了不同模态数据之间的潜在关联、序列数据的层级化注意力机制以及模态变化的异步性等问题,并构建相应深度学习网络进行模型学习,从多角度实现了多模态数据融合,通过多模态的互补性挖掘实现视觉自然语言描述的生成。3.本文针对数据驱动的视觉解析模型缺乏评价准则引导问题,提出基于强化学习的视觉类人解析框架,实现了多层级奖惩机制引导的多层级策略网络优化。该框架可嵌入当前代表性视觉解析网络、生成语句的评测指标以及视觉与语义相关函数,因此具有很强的扩展性和灵活性。在此基础上,通过多类视觉解析网络和客观评价指标的对比,验证了方法可行性。

其他文献

革命的游卒-聂绀弩论

本文讨论革命洪流中的聂绀弩(1903-1986)以及他的文学活动。本文共四章。第一章讨论聂绀弩和革命组织之间冲突。聂绀弩参加革命,有一定的被动性。他在国民革命时期加入国民党

学位

聂绀弩革命文明批评与社会批评检讨旧体诗

丝状真菌Mucor sp.ZG-3联合嗜酸性硫杆菌Acidithiobacillus ferrooxidans LX5的生物沥浸法促进污泥脱水的研究

全国城市污泥产量逐年递增,污泥的高含水率严重制约着污泥的后续利用。以降低污泥含水率为目标的污泥深度脱水技术已成为国内外污泥处置领域的研究热点。起源于微生物湿法冶

学位

城市污泥污泥脱水生物沥浸Mucor sp.ZG-3A.ferrooxidans LX5

簇毛麦CMPG1-V基因抗白粉病作用机制的分析

小麦白粉病是由小麦白粉病菌(Blurmeria graminis f.sp.tritici,Bgt)引发的真菌性病害,是世界上许多国家小麦生产中危害日趋严重的病害之一。抗白粉病基因Pm21来自小麦近源物

学位

小麦簇毛麦白粉病CMPGE3泛素连接酶

多参量异构光纤传感网理论及关键技术研究

本文总结了多参量光纤传感网研究现状,针对多参量光纤传感网组网结构简单、数据并发采集和处理能力弱、波长解调精度低等不足和缺点,分别提出了一种多路复用的多参量异构光纤

学位

多参量传感光纤传感网并行数据采集大数据处理多路复用光纤布拉格光栅法布里-珀罗标准具

单侧低水压作用下临空煤柱变形破坏及锚注加固机理研究

沿空掘巷在煤炭开采中广泛采用,小煤柱将巷道与采空区隔离,防止采空区水与有害气体串入巷道。采空区积水条件下,虽水压较低,但会造成煤柱承载能力降低、变形加剧甚至破坏,且

学位

临空煤柱裂隙网络模型单侧低水压变形破坏机理渗透特性锚注加固

华北克拉通胶北地块高压麻粒岩与斜长角闪岩的变质作用及年代学研究

胶北地块位于华北克拉通东部陆块,胶-辽-吉活动带的南段,是前寒武纪重要核心地体。TTG片麻岩中以捕虏体形式产出的高压基性麻粒岩和空间位置与之密切相关的高压长英质麻粒岩

学位

基性麻粒岩长英质麻粒岩斜长角闪岩变质作用年代学P-T-t轨迹胶-辽-吉带华北克拉通

二次电池碳基电极材料制备及其电化学性能研究

锂离子电池已经被广泛应用于移动电子、电动汽车等领域。随着清洁能源的开发和利用进程的推进,对电池提出了更高的要求,如更长的充放电寿命、更高的能量密度、更低的成本等。

学位

锂离子电池锂硫电池钠离子电池硅负极硫正极碳材料

新中国成立初期少数民族的国家认同研究（1949-1956）

作为国家的一种软实力,国家认同能把整个国家共同体中的单个个体团结起来,对于维系多民族国家的统一,保障多民族国家的稳定,促进国家的繁荣昌盛具有极其重要的作用。1949年10

学位

新中国成立初期少数民族国家认同

CoCrFeMnNi基高熵合金涂层组织演化机制及耐磨耐蚀性能研究

开发海洋装备关键部件用耐磨耐蚀材料是保障海洋装备安全可靠运行的关键。高熵合金(High-entropy Alloys,简称HEAs)涂层具有优良的耐磨耐蚀性,是极具发展潜力的海洋装备材料

学位

等离子熔覆高熵合金涂层多级纳米沉淀共晶组织耐磨耐蚀

近床面泥沙水流作用力及其在离散颗粒模型中的应用

水流泥沙的耦合运动决定河流、海岸的演变以及工程结构物周围的地形冲淤变化,因此水沙耦合运动研究具有重要的工程意义。随着并行能力的提升和并行计算技术的发展,基于离散颗

学位

水沙作用力公式水沙两相流近底泥沙CFD-DPM颗粒解析模型

视觉语义理解关键技术研究

其他学术论文