论文部分内容阅读
自人工智能诞生起,视觉相关的研究就一直是该领域的重点,而目标检测作为计算机视觉的基础与核心是研究的重要课题之一,已经广泛应用于人们的生活,例如电力监控、交通预警、自动驾驶等。经过科研工作者的不断努力,目标检测算法越来越成熟,从传统的目标检测算法到基于深度学习的目标检测算法,再从基于深度学习的目标检测算法分为基于候选区域的目标检测算法和基于回归的目标检测算法,视觉领域的目标检测体系日益完善,但基于候选区域的目标检测算法存在检测速度慢的问题,而基于回归的目标检测算法存在检测精度低的问题。从实用性的角度出发,检测精度与检测速度一直以来都是目标检测算法研究的重点,而针对复杂场景下小目标检测问题,始终都是目标检测算法的难点,由于小目标在整幅影像中的比重较小,特征提取较难,所以在实际检测任务中,漏检问题是小目标检测的一个主要问题。面对小目标的检测问题,本文系统总结了国内外目标检测算法的发展历史、卷积神经网络的理论基础以及卷积神经网络在目标检测领域的最新研究成果,主要以解决实际问题的立场出发,阐述以深度学习的技术层面解决电力线巡检中的小目标漏检问题,在SSD目标检测架构基础之上,提出了MFPSSD(Multidirectional Feature Pyramid Single Shot Detector,MFPSSD)目标检测算法,文章的主要工作内容包括以下三部分:(1)SSD作为基于回归检测的经典深度学习目标检测算法,在检测速度和检测精度方面具有优秀的性能,但对于小目标有较高的漏检率,为了解决这个问题,本文将多向特征金字塔结构引入SSD目标检测框架,提出一种MFPSSD目标检测网络。MFPSSD网络通过多向特征金字塔的结构充分利用低层卷积层的位置信息,以多种路径与高层语义信息进行融合,生成鲁棒性更强的特征映射图,对多尺度的目标检测更敏感。通过在高压塔缺陷数据集和DOTA公开数据集的验证测试,MFPSSD检测算法性能更优异,在一定程度上解决了小目标检测困难的难题。(2)本文提出了将K-means算法引入SSD算法的默认框设置,首先利用K-means算法对训练集进行聚类分析,得出符合实际目标特征的默认框比例,然后进行设置,通过在测试集的验证,该算法可以有效提高目标检测速度。(3)本文提出的MFPSSD检测框架,首先利用公共数据集进行骨干网络的训练,得到特征提取能力优异的特征提取网络,之后将特征提取网络嵌入整体的MFPSSD框架,然后在高压塔航拍影像数据集、DOTA遥感数据集进行检测网络的整体训练得到训练后模型,并与当前主流的目标检测算法进行对比实验,本文提出的MFPSSD目标检测算法,有效的提高了检测性能。