论文部分内容阅读
近年来深度神经网络在图像分类、目标检测与实例分割等方面取得了重大进展。训练深度神经网络需要大量的训练数据,对人力标注提出了巨大的挑战。有些领域的图像标注匮乏,例如生物细胞图像,生物学家希望采用较少的人力完成细胞标注。半自动标注方法即采用深度学习技术对图像进行预测并由标注人员进行少量修改,是提升标注效率的有效手段,对于加快生物学家的实验流程具有重要意义。本文以细胞图像实例分割任务为例,以减少人力标注为目标,重点对半自动标注的深度学习方法进行研究,主要内容如下:针对细胞图像实例分割问题提出一种基于深度学习的半自动标注框架。针对未标注数据,首先采用标注工具对一张或若干张的全部或局部图像区域进行标注,并使用标注过的小样本数据训练深度神经网络模型。利用该模型预测下一个未标注的图像作为标注人员的初始标注供标注人员修改。本文的研究重点为如何在小样本或部分标注的条件下提升深度学习模型性能。基于本文提出的半自动标注框架,研究了小样本条件下基于Mask R-CNN迁移学习方法对半自动标注的效率提升。实验结果表明,在Imagenet上预训练的Mask R-CNN模型在小样本条件下具有一定的迁移性,能够大幅度地提升标注效率。针对小样本条件下提升深度学习模型性能问题,本文提出一种基于训练图像生成的实例分割方法。提取细胞图片中的背景图像块,利用生成式对抗网络生成背景信息。提出细胞粘贴算法用于生成大量含有标记信息的细胞图片作为训练集,并采用Mask R-CNN进行训练。实验结果表明该方法小样本数据上模型性能具有较大提升,进而提高标注效率。针对标注完整图像耗时长的问题,本文提出了一种基于弱监督学习的实例分割方法。首先提出了基于轮廓的目标提取算法用于提取部分较容易分割的目标,采用交互式的方式对图像的部分背景与目标进行标注。结合训练图像生成算法生成大量训练图像,并采用Mask R-CNN进行训练。实验结果表明该方法能够在花费较少的标注时间下大幅提升标注效率。本文对实际标注时间进行了比较分析,分析表明本文提出的方法能够有效降低人工标注时间,提供的半自动标注框架对其他领域图像的目标实例分割问题具有借鉴价值。