论文部分内容阅读
目标检测是计算机视觉领域的一个重要的分支,其主要目的是对给定的视频或图片进行分析处理,指出其中每一个目标的所属类别并在目标附近绘制出边界框来标注目标的位置。传统的目标检测算法基于手工提取的特征,算法的准确度较低并且泛化性能较弱。近些年,深度学习技术发展迅速,基于深度学习的目标检测算法采用卷积神经网络对特征进行提取,在检测准确度上取得了突破性进展,被广泛的应用于视频监控、智慧物流、医学图像分析、无人驾驶等领域。然而在实际的应用场景中,目标检测的速度较慢,检测效果也往往受目标物体的形变、遮挡以及环境变化等因素的影响,设计一个实时性好、鲁棒性强、检测准确度高的目标检测算法具有十分重要的研究意义。本文针对基于深度学习的目标检测算法所存在的问题,提出相应的解决方案,对基于深度学习的目标检测算法的研究起到了借鉴意义。本文的主要研究工作和研究成果如下:1)提出了一种基于聚类思想的多尺度特征检测方法。大部分的目标检测算法通常对网络提取到的最后一层特征图进行检测,并且对网络的参数设置比较随意。针对此问题,本文采用多尺度特征融合检测的方法,在多个不同尺度的特征图上进行目标的检测,提高网络的候选框生成数量,在设置网络参数时,通过预先对数据集进行聚类的方法来设计“锚点”尺寸,加快了网络的训练过程,最终在通用的目标检测数据集上进行验证,证明了基于聚类思想的多尺度特征检测方法在目标检测算法中的必要性和可行性。2)设计了一种基于残差网络的实时目标检测算法。由于基于深度学习的目标检测算法的检测速度往往和硬件的计算能力相关。对此,本文设计出一种基于残差网络的实时目标检测算法,通过将残差网络结构和深度可分离卷积相结合的方法,在保证网络模型良好的检测性能的同时,减少了网络模型的参数量,提高了算法的检测速度。通过在通用的检测数据集上进行验证,证明了本文所提出的算法在检测速度方面满足实时性的要求。3)针对实时目标检测算法的检测准确度较低的问题,提出了两种优化方法。一般来说在对算法的检测速度进行优化的同时,往往会造成检测准确度的下降,本文针对实时目标检测算法存在的数据集样本分布不均衡和遮挡目标检测效果不好的问题,分别设计了新的交叉熵损失函数和改进的非极大值抑制算法。新的损失函数不仅减少了不同类别的样本数目不均衡对目标检测准确度所带来的影响,还动态调整了简单样本和困难样本对损失函数的影响占比,增强了算法对困难样本的检测准确度。而改进的非极大值抑制算法在处理重叠目标时,降低了目标周围的候选框被抑制的概率,从而提高了检测的召回率指标。最终通过实验验证了经过优化的实时目标检测算法在准确度上得到了明显的提高。