论文部分内容阅读
目标检测,即在图像或者视频序列中定位出目标对象的所在位置并决定这些目标对象的所属类别。它是近年来计算机视觉、模式识别等领域的一个研究热点,在智能监控、人脸识别、人流检测等工业应用中日趋普遍。随着深度学习的兴起与其在计算机视觉领域的密切结合,目标检测领域出现了一批优秀的新算法。这些算法或在检测精度,或在实时性方面有突出的性能表现。本文围绕目标检测算法,系统研究了深度学习与其在目标检测算法的应用,并对目标检测两个经典算法 YOLO (You Look Only Once)和SSD (Single Shot MultiBox Detector)做出改进。本文主要贡献包括:
(1) 对卷积神经网络的基本运算和基本部件进行归纳总结。本文总结了目标检测算法研究必要的深度学习理论基础,包括常用层、激活函数、目标函数和正则化等。本文的两个检测模型YOLO和SSD,分别在Darknet和VGG卷积神经网络分类模型的基础上连接检测算子微调而成。卷积神经网络是这两个检测算法框架的重要组成部分。
(2) 提出YOLO算法的批再规范化处理算法。本文结合批再规范化算法处理小批样本以及非独立同分布数据的优势,引入批再规范化处理对YOLO网络结构予以改进:即把卷积层中经卷积运算产生的特征图看作神经元,并对其进行批再规范化处理。同时,在网络结构中移除Dropout,并增大网络模型训练的学习率。实验结果表明,该改进YOLO算法相对于原YOLO算法具有更高的检测精度、更快的实时检测速度以及通过适当设置批样本大小可使网络模型在训练时间和硬件设备方面成本有一定的降低。
(3) 提出一种加强SSD小目标检测能力的Atrous滤波器设计。改进算法在SSD网络结构的基础上,把第三、四层卷积层产生的特征图经过规范化后连接在一起,然后通过Atrous卷积运算提高这些特征图分辨率。这些特征图共同提供小目标的所需的特征。另外该SSD改进算法还加入SeLU (Scaled Exponential Linear Units)激活函数,并在数据预处理阶段设计了一套数据增广方法。实验表明,该改进算法框架相对于原SSD算法框架具有更高的检测精度,更优良的鲁棒性以及更明显的小目标检测效果。
(1) 对卷积神经网络的基本运算和基本部件进行归纳总结。本文总结了目标检测算法研究必要的深度学习理论基础,包括常用层、激活函数、目标函数和正则化等。本文的两个检测模型YOLO和SSD,分别在Darknet和VGG卷积神经网络分类模型的基础上连接检测算子微调而成。卷积神经网络是这两个检测算法框架的重要组成部分。
(2) 提出YOLO算法的批再规范化处理算法。本文结合批再规范化算法处理小批样本以及非独立同分布数据的优势,引入批再规范化处理对YOLO网络结构予以改进:即把卷积层中经卷积运算产生的特征图看作神经元,并对其进行批再规范化处理。同时,在网络结构中移除Dropout,并增大网络模型训练的学习率。实验结果表明,该改进YOLO算法相对于原YOLO算法具有更高的检测精度、更快的实时检测速度以及通过适当设置批样本大小可使网络模型在训练时间和硬件设备方面成本有一定的降低。
(3) 提出一种加强SSD小目标检测能力的Atrous滤波器设计。改进算法在SSD网络结构的基础上,把第三、四层卷积层产生的特征图经过规范化后连接在一起,然后通过Atrous卷积运算提高这些特征图分辨率。这些特征图共同提供小目标的所需的特征。另外该SSD改进算法还加入SeLU (Scaled Exponential Linear Units)激活函数,并在数据预处理阶段设计了一套数据增广方法。实验表明,该改进算法框架相对于原SSD算法框架具有更高的检测精度,更优良的鲁棒性以及更明显的小目标检测效果。