论文部分内容阅读
以深度学习方法为基础的卷积神经网络是当前在目标检测领域中最流行,有效的方法之一。目标检测作为计算机视觉领域与图像处理的一个重要分支,被广泛应用于行人识别,工业故障检测,智慧安防等诸多热门领域。通过计算机实现的目标检测,可以大大提升工作效率,降低人力成本,同时目标检测是计算机视觉领域中,诸多高层级任务,如实例分割,全景分割,抠图的必备条件。当前目标检测方法主要以YOLO系列,Fast-Rcnn及其衍生版本组成。FCOS Detector更是其中一阶段anchor-free目标检测方法的典型代表,具有识别准确,占用内存小的特点。本文以FCOS Detector作为基础进行改进。本文主要工作如下:提出了一种新的权重分配策略,这是一种Soft Label Assignment方法。在传统的目标检测方法中,较常使用Hard label Assignment方法,即对于每一个anchor均根据其与目标框的相对位置而将每一个锚框点均划分为正样本或负样本。本文使用的方法不再做正负样本的划分,而是认为落入到目标框中的每一个锚框点均有正样本属性,也有负样本属性,根据训练过程中,每一个锚框点所预测出的预测框与目标框的IOU,分类分数,训练阶段,锚框点与目标框的相对位置等训练过程中的动态指标来设计正负样本属性权重,从而动态分配训练过程中计算的注意力。设计了一种衡量特征空间相似性的度量函数,不再以余弦相似性作为判别特征向量距离远近的标准。提出了一种空间对比损失函数,通过不断降低该损失,可以要求同一图像经过不同数据增强方式得到的图像之间以及具有相同类别待检测物体的图像之间,通过卷积神经网络所提取出的特征表示,具有最大的特征相似性,以此来提升所提取特征泛化能力。引入空间池化金字塔结构改进FCOS结构中的解耦头,融合多尺度特征,提升分类头特征提取能力,提出了一种基于自注意力机制的特征修正方法,两种结构与上文所述空间对比损失配合使用,可以得到待检测图像的一种更加泛化的特征表示。基于以上设计,我们实现了一个以FCOS结构为基础的目标检测模型。为了验证本文提出方法的有效性,本文从几个角度进行了详细的对比实验。包括在COCO数据集上进行的横向对比实验验证本文提出权重分配策略的有效性,实验结果表明,本文提出的权重分配策略在最重要的m AP指标上,分别较Mu Su,ATSS,Auto Assign等方法提升了1.9%,2.4%,2.2%。而在VOC数据集上进行的纵向对比实验表明,增加权重分配策略,相比于Baseline m AP指数增加1.2%,增加SPP模块进行特征整合,较上一步m AP指数提升0.5%,增加基于自注意力机制的空间对比损失,较上一步m AP指数提升3.2%。实验结果表明,本文提出方法在模型精准度,收敛速度,特征泛化性上取得了实验性改进。