基于高分辨率类别激活图的弱监督图像分割方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cz1502008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分割是计算机视觉和图像处理领域的核心研究问题之一。语义图像分割,作为其中一个重要的研究分支,其目标是将给定图像中的每个像素分类到某个已知的语义类别。近年来,基于深度卷积神经网络的语义图像分割方法取得了快速的发展,使用像素级标注的全监督方法在多个公开数据集上都取得了不错的表现。然而,这些方法的良好表现尤其依赖于大量的人工标注的图像分割数据。由于人工标注像素类别的成本较高,实际应用中通常难以获得大量的像素级标注数据。为了降低模型对于全像素标注数据的依赖,使用稀疏标注(例如目标边界框、图片类别等)的弱监督语义图像分割方法受到越来越多的关注。目前,针对基于图片类别标注的弱监督语义图像分割问题,主流方法大多采用了一个两阶段的训练框架来解决训练中监督缺失的问题。在这一框架中,第一阶段利用了图片的类别标注来训练一个图像分类模型,用以提取图像中目标对象的粗略定位;第二阶段中粗略的定位信息被转化为图像的伪像素分割标注,用以训练语义分割模型。在这当中,类别激活图(CAM)方法常被用于从图像分类模型中提取图像中语义目标的关注图,以反映目标的大致定位。目标关注图的质量会影响伪像素分割标注的精确度,从而影响语义分割模型的训练效果。因此,如何提升CAM方法提取高质量的目标关注图,成为一个重要的问题。目前基于CAM的伪像素标注生成方法存在的一个明显问题是,由于CAM方法需要从主干网络输出的高层特征图上提取目标关注图,目标关注图的分辨率通常很低。考虑到实际图像场景中目标物体的形态、颜色、纹理等特征的复杂变化,当应用低分辨率CAM目标关注图定位图像中的目标区域时,通常不能获得较为精细的目标捕捉。为了提高基于CAM方法的语义分割性能,本文提出了扩大CAM目标关注图分辨率的改进思路。受到多尺寸特征金字塔模型的启发,本文首先提出了基于多尺寸特征融合的改进思路。为了进一步改善大尺寸CAM目标关注图的精细化定位能力,后续的改进方法融入了基于注意力机制的特征增强。为了实现图像尺寸的高分辨率CAM生成,最终的改进方法放弃了传统的基于固定计算模式的CAM提取方法,而是采用了基于编码-解码网络的端到端CAM生成模型。针对三种改进方法的CAM生成及分割网络训练的实验表明,基于高分辨率CAM生成的方法相比基于传统CAM提取的方法有效提升了模型在弱监督语义图像分割任务上的性能。
其他文献
健康服务业与人们的生活息息相关,经过这些年的迅速发展,已成为我国的朝阳产业。随着新世纪互联网的快速成熟,健康服务业也出现了许多新的服务模式,尤其是互联网健康服务平台的出现,将线下零散的健康服务资源进行整合,为用户提供了更加方便快捷的健康服务。健康服务平台需要根据预约信息,将专家分派到不同的服务站中去为用户提供服务。在线下存在多个健康服务站的情形下,平台需要考虑如何高效合理地调度专家。本文对多服务站
随着图像数据的爆炸性增长,图像处理变得越来越重要。显著性目标检测是图像处理的重要研究方向之一,目标检测因其在真实世界的大量应用需求,比如自动驾驶、视频监控、机器人
有机半导体材料的电学,光学或光电行为是研究其光电子器件十分重要的参数。包括太阳能电池,场效应晶体管,光电探测器,传感器/智能检测等应用都存在有机半导体的身影。苝酰亚
在过去的几十年里,教学视频在教育领域应用逐渐广泛,其数量和质量都得到大幅增加和提高,成为了最受欢迎的学习方式之一。学习者可以通过中国大学MOOC、MOOC中国、网易公开课
为了更好地在新一轮能源产业变革中提供技术支撑,逆变器系统作为分布式微网系统的重要接口电路,不仅要满足清洁可再生能源发电对小型轻量化及冗余性的要求,还要保证其在不平衡工况条件下的供电质量。高频链矩阵式逆变器通过高频磁耦合的方式实现源、荷隔离,在保障用电安全的同时减小了系统的体积质量,利于系统的安装调试;三相四桥臂逆变器由于多出了一个桥臂,在其控制中相应地可增加了一个自由度,便于对不平衡工况下的零序电
本文主要考虑二次矩阵方程AX2+BX+C=0的数值求解方法.二次矩阵方程在材料学、物理学、工程学、控制理论和计算科学等诸多领域有着广泛而深刻的应用.对其解的数值求解方法是数值代数的重要研究内容.特别是近十几年随着计算机技术的飞速发展,非线性矩阵方程的数值解在计算数学领域和工程控制领域都逐渐发展成为了一个非常热门的课题.Higham等人于2001年提出了一种求解二次矩阵方程的带精确线性搜索的精确牛顿
无线片上网络(Wireless Network-on-Chip,WiNoC)可以实现高效的片上长距离通信,克服了传统金属互联片上网络长距离多跳传输带来的高能耗、高延迟通信瓶颈问题。在无线片上网
面部微表情是指面部肌肉的瞬间变化,表明一个人正在有意识或无意识地抑制自己的真实情绪甚至心理活动。因此,微表情识别吸引了生理学科和计算机视觉研究范围的多种研究工作,
高性能宽波段光电探测器由于其在光电子领域中重要的应用价值而引起了广泛的科学研究。近年来,二维材料由于其独特的光电特性被广泛应用于光电探测领域。在众多的二维材料体
网络能耗和数据传输可靠性是无线传感器网络路由算法重要的性能指标,分簇路由算法能有效均衡网络能耗,数据汇聚技术能提高网络能量利用率。但目前,兼顾网络能效和移动汇聚节