基于像素亲和性和语义信息的图像实例分割研究

来源 :中国科学技术大学 | 被引量 : 3次 | 上传用户:shs20000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像实例分割是计算机视觉方向的基本任务之一。给定一幅图像,实例分割任务旨在对图像中某些类别的实例进行像素级别的区分。传统的实例分割方法主要分为两类:基于候选框的实例分割方法和无候选框实例分割方法。基于候选框的实例分割方法先利用候选框对物体进行定位,再对找到的物体进行掩膜分割。而无候选框的实例分割方法则利用网络预测像素级别的实例信息,再对图像中的像素进行聚类。在无候选框的实例分割算法中,如何找到合适的实例级信息一直是研究的重点与难点。而在基于候选框的实例分割算法中,一方面,由于掩膜通常在备选区域内部产生,视觉表征的学习受到候选框范围的限制。另一方面,由于掩膜支路分辨率的限制,得到的掩膜结果十分粗糙。为了解决这些问题,提升实例分割算法的性能,得到更好的分割结果,本文将像素亲和性和语义信息显式地引入实例分割任务。本文的主要工作和创新点包含如下三个方面:第一,提出了基于图融合方法的无候选框实例分割算法。该算法将整幅图像作为一个图结构,利用神经网络预测图像的语义信息与亲和性信息作为图中的边,提出图融合方法将图中的像素聚类为不同的集合,最后得到不同的实例。该方法将像素亲和性与图像语义信息结合,并利用图融合算法推断出实例分割结果。实验结果表明,图融合算法可以有效的生成良好的图像实例分割结果,尤其相比于传统算法,图融合方法可以生成更细粒度的实例掩膜。第二,提出了基于全局上下文信息的实例分割算法。首先将语义信息作为辅助监督,加入网络训练中,以此帮助算法学习包含上下文的特征,同时对网络不同支路的输出进行约束,要求网络的掩膜支路输出与语义支路输出保持一致。为了增强对上下文的学习,引入基于自我注意力机制的全局聚合模块。同时,为了保证网络能够学习到位置信息,在掩膜支路引入了位置编码向量。实验结果表明,该方法可以在不引入额外计算开销的情况下在不同的基础网络结构上得到性能的提升。第三,基于像素亲和性的实例分割优化方法。对于基于候选框的实例分割算法,实例掩膜的结果通常由固定分辨率的掩膜支路输出插值得到,这样得到的掩膜往往十分粗糙,边界部分无法贴合物体。为了解决这一问题,提出了基于像素亲和性的实例分割优化方法,该方法首先将图像的像素亲和性与语义信息加入基于候选框的实例分割算法中作为一个辅助监督,帮助网络更好的学习特征。更进一步地,对于预测得到的像素亲和性和语义信息,将图融合算法引入基于候选框的实例分割算法中来,利用预测得到的像素亲和性,结合网络输出的先验,对基于候选框的实例分割算法结果进行优化,以此得到更精细的掩膜结果。实验结果表明,在不同的标准数据集上,该方法都可以提升实例分割算法的性能,得到更精细的掩膜。
其他文献
新中国成立后,因修建工程而引发的大规模人口迁移多次发生。三门峡水库区的移民又是其中十分典型的一例。本文以陕西省三门峡库区移民为中心,探究国家、社会和移民等各方力量
植物类受体蛋白激酶(receptor-like protein kinases,RLKs)是一类丝氨酸/苏氨酸蛋白激酶,在植物的生长发育及胁迫响应等过程中发挥着重要的作用。由于具有类似动物受体蛋白激
近年来,声波在声人工材料中的传播特性引起了广泛关注。声人工材料一般由两种或两种以上弹性材料组合而成,常见的有声子晶体和声超常材料两种。它们的区别在于,声子晶体中复
老年高血压病与胰岛素抵抗陈文箫,翁元真,王丽纳,郭太林,董玲,蔡敏(福建省立医院,福州350001)近年来大量研究表明,胰岛素抵抗和高胰岛素血症在高血压病的发病中起重要作用。本文前瞻性观察老
水利是国民经济首位的基础设施和基础产业,农田水利是农业生产的基础和农业基础设施建设的中心环节。
近年来,在国内外的露天矿山、水利、铁路工程等方面,层状岩质反倾边坡倾倒变形和滑坡破坏时常发生,对人类工程活动产生严重威胁,因此开展反倾边坡失稳机理及治理措施探究极为
近年来心脏起搏技术在临床上已广泛应用,特别是在房性心律失常的预防和治疗方面发展迅速。起搏器功能程序设计日益完善,尤其在心房颤动的防治方面取得了较好的临床效果。因此深
<正> 糖尿病蛋白尿是糖尿病肾病诊断的重要指标。晚近发现,糖尿病蛋白尿是糖尿病致死致残的常见而又最重要的危险因素之一。而糖尿病蛋白尿与心源性猝死又有何关系?我们就我