论文部分内容阅读
让机器为人工作一直是人类的追求,从工业革命机器解放了手工劳动者,到汽车代替了步行,到电脑解放了人类的计算。人类不断的发明新的东西,其目的大多是为了帮助人类。而在这方面最远大的追求无疑是发明一个像人类一样的机器,来帮助人类完成人类需要完成的一切。发明这样的机器以目前的技术来看还很遥远,但是如果发明一个拥有像人类视觉的机器似乎将要到来。计算机视觉就是在做这样的事情,而目标检测技术则是计算机视觉最核心的内容。目标检测的目标旨在让计算机理解图像中有什么以及它们在哪里?这项技术的进步将在很多领域帮助到人类,如监控,字符串识别,癌症检测等等,因此对目标检测的研究尤为重要。本文的主要工作是提出了一个复杂环境下的目标检测算法,其主要工作如下:提出了一个复杂环境下的多目标检测算法SFD-Net(Separable focal detector network,SFD-Net),该网络设计主要包含在两个方面,骨干网络和头部网络,骨干网络的设计采用了经典的VGG网络用作图像的特征抽取,头部网络的设计中采用了自己提出的DS Block用来融合特征,使低层次的卷积网络有了更好的特征表达,有利于网络提升小目标的检测效果。在对目标类别预测的时候使用了focal loss以便使整个网络更好的优化目标而不是背景。最后在整个网络的设计上采用了一阶目标检测算法的方案,在保证目标检测的精度下几乎不会损失速度。设计了一个目标检测系统,该系统包含了数据预处理模块,模型训练模块,模型测试模块和目标检测模块。各个模块都可以独立使用,本文设计的SFD-Net长达两个月的实验均使用了该系统的模块。为了验证SFD-Net网络的有效性,本文在两个标准数据集Pascal VOC和MS COCO和自制数据集Panda上分别作了实验。第一个实验基于Pascal VOC数据集,证明了SFD-Net在目标检测上上的有效性以及各类别测准率与类别分布并无直接相关关系;第二个实验基于MS COCO数据集,证明SFD-Net在复杂环境下的目标检测能力以及对于小目标的检测有明显提升;第三个实验基于自制的Panda数据集,证明了SFD-Net在Panda数据集上的有效性和迁移学习过程中冻结参数的优势。证明了SFD-Net的有效性。