基于上下文信息聚合的语义分割与目标检测算法研究

来源 :南京邮电大学 | 被引量 : 2次 | 上传用户:yy5621913
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割(Semantic Segmentation)是计算机视觉领域经典的任务之一,它属于高层次的视觉任务并且在图像理解中扮演着及其重要的角色。图像语义分割属于密集像素分类问题,它的目的是为图像中每个像素点进行准确分类。图像目标检测(Object Detection)则是计算机视觉中另一个经典任务。相对于图像语义分割,图像目标检测属于计算机视觉的中层次任务,它的目的是为图像中存在的物体进行分类并找到其所对应的包围框。图像语义分割和图像目标检测任务都是由分类和定位两个子任务组成。近年来,深度学习(Deep Learning)在计算机视觉领域中发展迅速,而卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习的重中之重,愈来愈多的研究者将目光聚焦于此。相对于传统的图像处理算法,卷积神经网络能够高效地提取图像特征,基于此特点,卷积神经网络也为图像语义分割和图像目标检测任务提供了新的研究思路。目前大部分的卷积神经网络是为图像物体分类而设计的,并不能够直接用来解决语义分割或者目标检测问题。这种网络的深层可以很好地提取语义信息,这些语义信息虽然对物体分类有益,但是缺失了大量的位置信息;相反的,浅层提取的特征虽然具有丰富的位置信息,但是却缺乏语义信息。基于这些研究发现,本文主要进行了如下研究:(1)本文提出了一种通用的语义分割架构-上下文信息聚合网络(Contextual Aggregating Network,CAN),它是由骨干网和上下文融合网络组成,能够很好地利用卷积神经网络的上下文信息解决语义分割任务(利用浅层的位置信息解决定位子任务,利用深层的语义信息解决分类子任务)。CAN提出了上下文卷积单元(Context Convolutional Unit,CCU)来对骨干网中间层的信息进行精炼提取,再通过多分辨率融合模块将高层次的语义信息和低层次的位置信息融合,最终通过输出卷积产生更为准确的语义分割输出。此外,本文还使用端到端的方式训练CAN,这种训练方式可以有助于提高语义分割算法的性能。(2)为了在图像语义分割的分类和定位子任务中取得更好的平衡并解决目前大部分语义分割架构存在的特征映射不充分的问题,本文提出了双向上下文信息聚合网络(Bi-directional Context Aggregation Network,Bi CANet),它是由骨干网,上下文压缩映射模块(Contextual Condensed Projection Block,CCPB),双向信息聚合模块(Bi-directional Contextual Interaction Block,BCIB),通道注意力模块(Channel Attention Block,CAB)以及多尺度上下文融合模块(Multi-scale Context Fusion Block,MCFB)组成。Bi CANet架构去除了骨干网中对定位任务有害的池化层。并设计了CCPB来对骨干网中的特征做进一步的精炼提取。为了充分融合和利用骨干网中上下文信息,Bi CANet提出了BCIB对精炼提取后的浅层位置信息和深层语义信息进行更好的特征融合,再将融合后的特征通过CAB进行通道筛选。最后Bi CANet提出了MCFB来将特征图更好地映射到语义分数图,从而得到更佳的语义分割精度。(3)图像目标检测任务同样存在分类和定位子任务不可兼得的问题,为了解决目标检测任务中这一问题并验证本文提出的用于语义分割任务的优化思想在图像目标检测任务上同样有效,本文提出了上下文信息聚合检测网络(Single-Shot Contextual Aggregating Network for Object Detection,CADet)。定性和定量的实验结果证明,本文提出的语义分割算法在CITYSCAPES,PASCAL VOC2012以及ADE20k三个数据集上的分割性能均达到了当前最高水平(State Of The Art,SOTA)。本文提出的目标检测算法借鉴了本文所提出的语义分割算法思想,实验结果证明了该目标检测算法在数据集PASCAL VOC2012上具有一定的优越性,并且验证了本文提出的用于语义分割任务的优化思想对于解决目标检测任务中相似问题具有一定的通用性。
其他文献
【正】 武王定都洛邑是周初政治生活中至关重要的大事,其后周公营建洛邑,成王定鼎郏鄏迁宅成周;都是按照武王的遗愿进行的。但、是,这件大事仅见于《逸周书·度邑解》和
期刊
自1920s-1950s期间陆地棉引进中国,我国就开始了自育的陆地棉品种选育,目前在棉花生产中陆地棉产量占全国棉花总产量的90%。本研究以从美国和前苏联引种及我国自育品种503份
《悲悼》三部曲(1929—1931)是奥尼尔借用希腊悲剧家埃斯库勒斯的《俄瑞斯忒亚》三联剧的情节框架来表现美国现实生活的一部悲剧。奥尼尔从现代心理学的角度对一个极其古老
目的:通过探讨急性胰腺炎(acute pancreatitis,AP)早期胰腺外常见的螺旋CT征象与其严重程度的关系,寻找对AP严重程度诊断价值高的征象,为临床早期评估急性胰腺炎的严重程度提
<正>1档案收藏重利用、轻收藏,重数量、轻质量,征集者思想要转变1.1档案部门的功能是双重的,一是收藏,二是利用。在收藏方面,征集工作者把主要精力放在了特色档案上,却轻视了
发展内陆开放型经济是重庆市为实现“314”总体部署作出的重大战略决策,大力发展会展业可促进内陆开放型经济的发展。重庆已经基本具备建成“西部国际会展之都”的条件,要明确
中国是花卉种植大国,种类资源丰富,栽培历史悠久,相关从业人员众多。其中,花卉分类是植物学研究领域和花卉业生产中重要的基础性工作,从而花卉分类学是一项具有长远意义的基
第一部分:磷酸二酯酶-4抑制剂Ro 20-1724对重复氯胺酮麻醉所致幼年大鼠学习记忆障碍的影响目的:观察磷酸二酯酶-4抑制剂(PDE-4I)Ro 20-1724对幼年大鼠重复氯胺酮麻醉诱导的学
[目的/意义]结合传统引文指标与学者文献的引用关系数据,对学者的学术影响力进行综合测度。准确且高效地测度学者的学术影响力,使测度结果更加合理科学。[方法/过程]提出学者
目的:探讨老年髋部骨折术后谵妄的原因,进而提出护理对策。方法:比较髋部骨折手术后24例出现谵妄患者的手术前后红细胞比容、血红蛋白变化,同时对手术时间、麻醉方式、术中出血