论文部分内容阅读
本文提出了一种用于全景分割的多任务学习深层神经网络,其目标是为输入图像的每个像素提供类别标签和实例编号.该网络模型同时进行语义分割和实例分割预测,并把他们的预测结果组合起来形成全景分割的输出.首先,使用带有特征金字塔网络的ResNet50主干网络进行特征提取;然后,把提取的特征分别用于语义分割及实例分割分支,并在两个任务之间共享信息;最后,通过空间排序模块把两个子任务的输出结果融合,得到全景分割的最终输出结果.本文的网络模型在数据集Cityscapes与COCO上进行了训练与测试,实验结果表明,通过