知识引导的自适应图像理解

来源 :南开大学 | 被引量 : 0次 | 上传用户:jeff006902000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何使机器系统具有像人一样强大的视觉信息处理和理解能力是计算机视觉的主要研究目标。近年来,深度学习推动计算机视觉向该目标迅速前进,但基于深度学习的方法通常依赖大量的带有标注的训练数据并且具有较大的计算量。与人类的视觉系统相比,计算机视觉目前面临着三个主要挑战:1.数据有限:人类从出生开始,日积月累地接受了海量的训练数据,而人们无法为机器学习系统收集如此海量的数据;2.计算资源有限:人类大脑可以快速地处理视觉信息,计算能力比最强的超算还强,而现实中的机器往往计算能力有限,尤其是移动设备;3.标注有限:标注数据是非常昂贵且耗时的,尤其是对于像素级别的图像理解来说。因此,如何在数据有限、资源受限、标注有限的条件下使机器能够理解无限复杂的真实世界成为了一个亟待解决的问题。为此,本文提出了知识引导的自适应图像理解。具体来说,受人类视觉系统的启发,本文提出用图像边缘、图像过分割、图像显著性、以及似物性采样等通用的图像属性知识来辅助机器对图像进行理解,以解决数据有限的问题。本文通过研究基于轻量级卷积神经网络的图像理解来降低深度学习的计算量,以自适应计算资源有限的环境。以通用的图像属性知识为基础,本文通过研究基于弱监督学习的图像理解来解决标注数据有限的问题。由于像素级别的图像理解最具有代表性和广阔的应用场景,本文以实例分割和语义分割作为应用验证。围绕上述分析,本文的主要研究内容和创新点如下:1.设计了基于多层次多粒度深度网络的图像通用属性提取方法,克服了目标任务数据有限的难题:(a)充分利用来自卷积神经网络所有卷积层的卷积特征,提出了基于更丰富卷积特征的边缘检测技术,是第一个在著名的BSDS500数据集上以实时的速度超越人类标注的边缘检测算法。相关研究成果发表于IEEE CVPR 2017、IEEE TPAMI、IJCV。(b)利用超像素包含比单独的像素点更丰富信息的特点,提出了基于分层区域合并的实时图像过分割算法;并进一步提出了基于深度特征嵌入学习的图像过分割算法,进一步提升了性能,且保持了较快的速度。相关研究成果发表于ECCV 2016和IJCAI 2018。(c)通过理论和实验证明显著性检测中广泛使用的基于深监督的线性融合不是最优的,并进而提出了基于深监督的非线性融合技术,从而提高了显著性检测的性能。相关研究成果发表于IEEE ICCV 2017、AAAI 2020、IEEE TCYB。(d)利用传统似物性采样算法的密集采样和深度学习的强大表征能力,提出了一种通过精炼传统方法的采样结果来生成少量且高质量的物体推荐的方法。相关研究成果发表于IEEE TPAMI、CVM、IEEE CVPR 2020、Neurocomputing。2.基于语义分割需要丰富的多尺度信息以识别自然图像中多变的物体的特点,提出了一个基于多尺度学习的高效的轻量级卷积神经网络模型,从而自适应资源受限的环境。相关研究成果发表于IEEE TPAMI。3.利用通用的图像属性知识,提出了一种基于多实例学习和多路割的弱监督实例/语义分割方法,所提出的方法同时在弱监督实例分割和弱监督语义分割两个任务上达到了目前最优的性能。相关研究成果发表于IEEE TPAMI。
其他文献
有机太阳能电池具有质轻、柔性、半透明、可大面积印刷制备等诸多优点,是一种具有重大应用前景的绿色能源技术。近年来,随着新材料,特别是A-D-A结构光伏材料的设计开发,与器件工艺的提升,有机太阳能电池的能量转换效率不断获得突破。本论文围绕A-D-A结构受体材料的设计与合成及其光伏器件的制备和优化开展研究。论文研究内容主要分为以下四个部分:一、以高效率叠层器件为研究对象,提出一个半经验模型,分析预测了有
学位
环丙沙星是恩诺沙星的主要代谢产物,因其抗菌谱广、杀菌力强、起效快等优点而被广泛应用,在土壤、水体等环境中被不同程度检出,然而目前有关环丙沙星对鱼类早期生命发育阶段的神经毒性效应研究较少。采用模式动物斑马鱼(Danio rerio)作为研究对象,在0.1、1 mg·L-1浓度水平上,从胚胎自发运动、运动活性、乙酰胆碱酶活性及多巴胺、血清素通路和神经发育关键基因的表达等方面评估环丙沙星对斑马鱼早期发育
期刊
有机电子给体(Donor)和电子受体(Acceptor)通过给-受体(Donor-Acceptor,D-A)作用可实现D和A组分间的堆积组装和可调的电荷转移/分离、能量传递等电子相关过程,是有机D-A光、电材料体系功能导向设计构筑的核心。本论文中,我们将D、A功能基元分别作为客体和配体引入配位聚合物(Coordination Polymers)中,利用D-A作用与配位作用的协同效应,在限域主-客体
学位
钢琴作为“音乐之王”,在漫长的发展历程中,西方许多国家都出现了优秀的钢琴演奏家和钢琴作品,并且逐渐形成了各自的体系,之后又演变成许多钢琴学派,例如,法国、俄罗斯、德奥钢琴学派等。这些学派特点鲜明,各有不同,但又体现出一定的共性。拟主要阐述西方钢琴体系与学派,并且对几个具有代表性的学派进行艺术分析与教育理论刍议,目的在于给中国钢琴学派发展提供借鉴,促进中国钢琴艺术的健康发展。
期刊
Cu2Zn Sn(S,Se)4(CZTSSe)薄膜的组成元素储量丰富、安全无毒,目前受到了越来越广泛的关注。采用溶胶-凝胶法制备前驱体薄膜后经高温硒化过程得到CZTSSe薄膜是一种通用的光伏技术路线。国内外研究者们对溶胶-凝胶法制备的CZTSSe薄膜太阳电池进行了多年研究并且取得了丰富的理论与实验经验,但其转换效率仍与其理论转换效率有着较大差距。本文以制备高效环保、低成本的CZTSSe薄膜太阳电池
学位
中德职业教育汽车合作(SGAVE)项目人才培养目标旨在精准定位“汽车机电工程师”工作岗位的综合能力要求。为了开发适合我国高职汽车检测与维修技术专业、汽车制造与试验技术专业本土的“学习领域”课程模式。本文从职业工作过程出发,利用“教学论反射”原理,建设从职业行动领域到课程学习领域到学习情境的课程体系,夯实本土化的“学习领域”课程模式在应用中的实践基础。提出以“客户业务委托”为起点,导入学习任务;以“
期刊
应用面向降水过程的时空检验方法,评估了中国气象局广东快速更新同化数值预报系统(CMA-GD)、上海数值预报系统(CMA-SH9)和中尺度天气数值预报系统(CMA-MESO)的海南岛暖季(2019—2020年的4—9月)非台风降水日小时降水预报效果,结果表明:三家模式均能捕捉不同流场条件下的降水空间分布形态及降水日变化特征,但CMA-GD和CMASH9的降水频率和强度总体偏多偏强,其中CMA-GD降
期刊
学位
埃可病毒30(echovirus 30,E30)型为人源性肠道病毒B家族的一个重要成员,是引起人病毒性脑炎和脑膜炎最主要的病原体之一;近年来,在欧洲、亚洲以及南美洲呈较大规模的季节性和周期性流行。然而,目前尚无用于防治肠道病毒B家族成员感染的特异性药物或疫苗。虽然B家族部分成员的成熟颗粒的原子结构已经被成功解析,但人们对该家族成员处于生命周期不同阶段的其它形式的颗粒特征却知之甚少,对决定不同病毒成
学位
随着医疗基础研究的飞速发展,间充质干细胞的功能用途也日益多样化。间充质干细胞具有强大的增殖能力和多向分化潜能,使得其在人体的多种系统里都可以充分发挥作用;它同时还具有较好的免疫调节功能和低程度的异体移植排异性。此外,间充质干细胞来源相对广泛易得,易于进行培养增殖分化,即使传代多次,其干细胞特性仍可维持稳定。诸多优势使它成为近年来研究的前沿热点,而对于骨科而言,它的成骨性、成软骨性及成纤维细胞性最博
期刊