【摘 要】
:
目标检测和实例分割任务都是对图像中的每一个对象进行辨别,它们具有一定的相似性,很多工作也在目标检测的基础上完成实例分割任务。二阶段目标检测模型可以通过简单的扩展就
论文部分内容阅读
目标检测和实例分割任务都是对图像中的每一个对象进行辨别,它们具有一定的相似性,很多工作也在目标检测的基础上完成实例分割任务。二阶段目标检测模型可以通过简单的扩展就能完成实例分割任务,但这种扩展在一阶段模型中却难以做好。本文的工作是在一阶段目标检测模型的基础上设计一种实例分割扩展方法,使这种简单通用的扩展方法能够在保持目标检测性能的同时得到高质量的实例分割结果。基准目标检测模型在特征金字塔的各层分别识别不同大小的对象(对象流),以点对象的形式表达图中对象的各个属性(类别、检测框),但却很难同样地表达一个对象的分割掩膜。为此,本文的扩展方法首先在FPN的最底层(P3)扩展一个全卷积的分割流,分割流输出一组分割基底,同时在对象流上加入一组与分割基底对应的组合系数。一个图像经过网络生成一组分割基底,并由对象流生成的组合系数(负责分辨不同的对象),两者的线性组合最终得到对象的实例分割掩膜。扩展后的模型在训练中会出现对象流和分割流两者收敛不一致的问题,本文提出为不同卷积流应用不同学习率的策略来解决。扩展模型的最后是一个后处理重组方法,该方法在原有NMS算法的基础上改善了对分割掩膜的处理,在不影响原有目标检测性能的基础上提升了实例分割的精度。分割基底和组合系数的线性组合过程涉及三次激活函数,不同的激活函数组合会引导出不同的分割基底结果。本文通过图示分析了不同组合方式的效果,并得出其中分割精度结果最优的一组组合方式:以softmax函数激活组合系数,以sigmoid函数激活分割基底,线性组合后无需激活。但该组合方式仍然难以应对同类对象存在检测框重叠关系的情况,本文提出一种并集区域损失策略来解决这个问题,该策略使得模型能够学习出点对象和分割基底之间的多对多关系,真正做到让两个存在检测框重叠关系的目标对象被“分解”到两个不同的分割基底上。最后,本文还提出一种交叉注意力模块,它是一个连接网络C2与P3部分的连接模块,它让分割流能够得到有效的提升。本文在对一阶段目标检测模型的扩展过程中,提出了几项提升改进的方法,这些改进方法与基于分割基底组合的扩展一样,具备通用性,可以针对不同的模型加入这些改进,并带来提升。
其他文献
随着计算机技术的快速发展和数字视频技术的广泛应用,视频数据呈爆炸式增长。如何有效地管理和储存视频信息成为当前信息处理研究的难点和热点。以方便视频浏览和管理为目的
北祁连造山带是中祁连地块与北部阿拉善地块在加里东期碰撞而成,该区地质背景特殊,成矿构造环境优越,是我国重要的多金属成矿带。红土沟金矿位于北祁连造山带中段,该矿床实际工作程度较高,但理论研究工作程度较低,尤其是在矿床地质特征和年代学研究方面。本次研究在系统整理和分析前人研究资料基础之上,结合野外调查实践,并通过电子探针、岩石地球化学和锆石SHRIMP U-Pb定年等相关研究,取得的主要成果和认识如下
近30多年来,以红外探测器为核心的红外技术得到了快速发展,除了应用领域得到拓宽,其本身的创新也层出不穷。随着微机电一体的发展,器件越来越小型化,同时为了提高系统的分辨率和目标识别能力,这就要求探测器具备高灵敏度和高效光能利用率。设计微透镜阵列,将入射到像元区域的光集中到更小的光敏区域,这样既提高了光能利用率,同时也避免了像元之间的串扰。本论文从透镜聚焦这一性能角度出发,为红外焦平面探测器提供一种聚
智能配电网作为智能电网的重要组成部分,是连接电力企业与电力用户之间的重要一环。智能配电网侧大量分布式能源和配电终端的接入,使得需处理和存储的数据呈现海量式增长,传
连铸是钢铁工业生产过程中的重要环节,在连铸生产的浇注过程中,大包内的炉渣容易随钢液流入中间包,从而对生产效率和铸钢成品质量造成严重影响。因此,对钢包进行下渣检测是连
红外探测器自问世以来一直是军事领域的焦点,二十世纪九十年代非制冷红外焦平面探测器的出现更是引起军事装备的进一步升级,在单兵作战方面尤为突出。随着应用的普及,以非制冷红外焦平面探测器为核心的红外成像设备在公共安全、工业、医学等领域的作用也越来越突出,其市场的不断扩大引起越来越多的关注。本文的工作内容是制备出性能优良的亚稳相二氧化钒(VO_2(B))材料,以应用于非制冷红外焦平面探测器的像元热敏电阻材
互联网技术给人们的生活各个方面提供巨大便利,但另一方面也为恶意程序的产生和传播提供了方便,给信息系统造成严重的安全威胁。随着计算机系统虚拟化技术的发展,虚拟机(Virtual Machine,VM)的应用领域愈加广泛,利用虚拟机对恶意程序的检测技术已经成为当前的研究热点之一。本文基于虚拟机监视器研究程序行为的分析及检测技术。通过虚拟机监视器,获取程序运行时的虚拟机系统底层信息,从计算机系统资源域的
滚动轴承是滚动设备中承载着旋转工作的主要部件。精准的诊断出轴承在运行时产生的故障,对保障工业生产,稳定产品性能,减少或避免重大生产事故甚至灾难,有着重要的意义。现代
本论文的研究工作以玻璃碳电极为基底材料,通过两步电化学沉积法将聚氨基酸(Poly(amino acid))和一种含钬离子杂金属氰桥配位聚合物(Ho(Ⅲ)-Fe(Ⅲ)-WO42-CyHMCP)复合修饰到电
随着人工智能的发展,无人驾驶已成为当今研究的热点之一。由于在道路信息当中,提供最多信息的是交通标志,故无人驾驶的关键之一便是建立对交通标志进行检测与识别的驾驶辅助