不完全标记的图像语义分割方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:dl_smh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全卷积神经网络为图像语义分割开辟了新的发展道路,使图像语义分割得到了迅猛发展。图像语义分割是将不同的图像区域解析为语义相关类别的视觉任务。图像语义分割在车辆自动驾驶、医学疾病诊断、视频监控等方面有着广泛的研究前景和实践意义。现有的主流全监督图像语义分割方法需要耗费大量人力进行像素级标注,因此,研究不完全标记的图像语义分割是一个具有实际意义的研究方向。然而,现有的使用相对容易标注样本的弱监督图像语义分割方法缺乏对端到端弱监督语义分割问题的讨论,训练过程复杂且性能不佳。此外,使用少量像素级标注样本的半监督图像语义分割方法,在利用一致性正则化方法中引入的噪声,往往会引导网络在训练初期朝着错误方向进行学习,导致半监督性能的下降。针对以上内容,本文研究内容和主要贡献包括以下三个方面:第一,提出了基于自注意力机制的端到端弱监督图像语义分割方法。针对现有的弱监督语义分割方法需要多个网络分别进行训练,训练过程繁琐且性能不佳的缺点。本方法将弱监督语义分割所需的分类网络、分割网络使用权重共享的主干网络进行连接,提出基于类激活图的自注意力模块提高目标定位能力。此外,引入重构分支进行图像重构任务,提出基于重构特征的自注意力模块细化分割预测结果。该模型不仅可以解决现有弱监督语义分割方法繁琐训练过程的弊端,而且在不添加额外显著性处理技巧的情况下,有效提高了分割性能。实验结果表明,本方法设计的端到端弱监督语义分割方法训练简单,模型性能获得有效提升。第二,提出了基于一致性正则化的半监督图像语义分割方法。如果仅使用弱监督语义分割方法,其性能始终与全监督图像语义分割方法之间有较大的差距。因此适当使用少量像素级样本作为训练样本可以更加接近全监督语义分割网络的性能。现有的半监督图像语义分割方法大多关注图像不同扰动的一致性,但是在训练初期对错误信息进行一致性约束容易导致网络奔溃以及引入许多不相关类别预测的问题。本方法不对输入数据添加任何噪声,利用误差网络单向指导,从不同角度提出三个约束损失:学生网络与教师网络之间的单向指导约束、分割预测误差并集约束以及特征一致性约束损失。大量的实验表明,本方法有效缓解训练初期错误信息的一致性约束,有效提升半监督语义分割的性能。第三,提出了不确定性感知的半监督图像语义分割方法。对方法二中使用误差图进行指导后,引入噪声样本的问题,提出通过预测样本方差的不确定性度量方式解释噪声样本,使用不确定性估计网络评价分割预测误差的置信图。本方法设计了一个不确定感知的半监督语义分割方法,利用引入的不确定性估计网络获得无标签数据的误差高置信区域和误差低置信区域,提出高置信分割约束损失以及低置信度误差约束损失。本方法的不确定性度量方式解决误差图存在的问题,准确评价分割误差。通过大量的实验结果表明,本方法超过了其他最新的流行方法,取得了显著的半监督性能。
其他文献
应用层次分析法确定农业绿色发展水平评价维度和评价指标,应用熵权法确定评价维度和评价指标的权重,应用综合指数法从社会发展、经济增长、农业生产、生态环境4个维度对山东省16个地市的农业绿色发展水平进行综合评价。结果显示:山东省各地市的农业绿色发展水平较高(指数平均值为0.43),地区间发展水平差距较小。但是各地市在社会发展、经济增长、农业生产、生态环境评价维度上表现各异。
期刊
近年来,语义分割在多个领域得到了广泛的应用。随着深度学习的快速发展,基于深度神经网络的语义分割在分割精度上不断提高,但巨大的参数量和计算量限制了网络在硬件上的部署,因而设计轻量级网络成为目前语义分割领域的研究热点。然而,传统的人工设计方法耗时耗力,因此研究者们希望将网络的设计过程自动化。于是,一些基于神经网络架构搜索的语义分割方法被陆续提出,并利用知识蒸馏技术,使用性能较高的大网络指导轻量级网络的
学位
自现代社会尤其是工业革命以来,化石能源的过度消耗造成了重大的能源短缺问题,学者们不断进行了新能源以及新型能源装置的广泛研究,致力于完成能源的可持续开发和利用,而超级电容器因为其高功率密度和卓越的稳定性引起广泛关注。相比于电池,超级电容器尽管有着充放电速度快的优势,但是其能量密度过低限制了其商业化应用的进程。而选择适宜的材料组装超级电容器,提高单位电容是电容器应用的核心问题,过渡金属氮化物作为一种新
学位
作为我国一种新兴的金融机构,村镇银行在弥补农村金融服务缺位等方面作出了突出贡献,为农村经济增长和小微企业发展提供了重要的金融支持。然而,随着村镇银行的快速发展,村镇银行的信贷风险不断增多,出现资产质量下降、贷款不良率上升、违规开展业务等一系列问题。甚至部分村镇银行没有建立信贷风险管理机制,一旦发生大规模信贷风险,将给储户和国家造成巨大的损失。鉴于此,文章对新时期村镇银行信贷风险管理存在的问题进行分
期刊
深度神经网络由于其出色的性能被广泛的应用到了各个领域中,但同时深度神经网络也具有计算量和参数量较大的弊端,这样的特点阻碍了深度神经网络的进一步发展。近年来大量的研究关注于深度神经网络的压缩与加速,并提出了多种有效的方法。一种常用的方法是神经网络的剪枝,但目前的剪枝方法大多都依赖手工设计剪枝模型结构和单一的剪枝算法,在面对不同的硬件或者压缩目标时欠缺灵活性,并且在压缩率较高的时候难以维持原有的性能。
学位
箱包重识别目的在于对箱包进行跨摄像机跟踪,其在机场以及海关安检等地方对丢失箱包寻找或可疑箱包追踪发挥重要的作用。目前主流技术是通过射频标签来实现定位跟踪,该标签可能存在运输过程意外脱落、人为撕开以及受金属干扰等问题。箱包重识别作为新型跟踪技术可以作为射频识别的代替或补充。由于该技术不需要物理标签,因此不会存在上述的问题且能够降低成本。然而箱包具有姿态变化大、相互遮挡以及个体间存在极为相似等情况从而
学位
视频目标检测与跟踪作为计算机视觉中的基础问题,已被广泛应用于视频监控、无人驾驶、增强现实等实际场景中。然而,由于实际场景的复杂性,视频中的目标往往会受到遮挡、模糊、相机失焦等问题的影响。这些问题使得视频目标检测与跟踪方法在实际应用中存在一定的局限性。与图像不同,视频包含丰富的时空(Spatial-Temporal)信息。通过充分挖掘视频中丰富的时空信息,可以有效提高视频目标检测与跟踪的精度。鉴于此
学位
具有丰富分子轨道和多个能级的有机分子已成为微型分子电子器件和热电材料的良好候选者,分子结的电输运及热电性质测量对于分子导电机制研究具有重要意义,也为推动集成电路工业小型化和高效热电转换的发展提供了新思路。随着扫描隧穿裂结等精密测量仪器技术的开发和拓展,众多单分子结或分子膜器件的热电性质被广泛研究,并初步开拓了热电性质基于分子与电极的接触效应、长度依赖性、分子内部取代基团、外部环境调控的变化规律。进
学位
合理膳食是老年人保持健康、防治慢性病的最佳途径之一。当前中国社会老龄化进程加速,老年人膳食健康问题也逐渐突显。一方面,随着老龄人口的增加以及对膳食健康的日渐重视,社会中对老年人膳食知识的需求迅速增长。另一方面,老年人缺乏获取全面的膳食知识的途径,且难以分辨互联网中混杂的信息。基于此,本文在保证易操作性的前提下,设计并实现老年人膳食问答推荐系统,精准实时地为广大老年人及其家属答疑解惑,方便用户快捷地
学位
深度学习已经成功地被应用于解决各种计算视觉问题。但在无人驾驶、机器人技术等应用场景下,图片无法提供感知环境所需的全部信息。相比于图像,三维数据可以更准确地还原现实场景,在不同应用场景的推动下,处理三维数据逐渐成为热门课题,其中点云作为较为简洁的三维数据的表示形式,不论是获取还是应用上都十分简便,因此高效地分析点云是让机器理解三维数据的关键。然而现存的方法存在诸多问题,比如,在点云场景语义分割任务中
学位