论文部分内容阅读
船只目标检测是利用算法自动识别出图像中船只的位置以及类别的过程,无论在民用领域还是在军用领域都有十分广泛的应用。以往的研究大多基于高分辨率遥感影像(雷达或者近红外),随着成像技术的发展,基于可见光成像的海上船只检测逐渐引起了学者以及工程师的关注,并且成为视频监控领域的研究热点。此外,卷积神经网络的崛起大大加快了数字图像处理技术的发展,基于深度学习的检测算法已经被广泛应用于计算机视觉的各类问题中。本论文首先构建了一个大规模、高质量的船只目标样本库SeaShips,用于检测模型的训练以及测试。样本库图像来源于安置在珠海横琴环岛的监控视频,通过提取帧数据、去除冗余图像、设计样本多样性、人工标注等步骤,论文得到6类船只(ore carrier、bulk cargo carrier、general cargo ship、container ship、fishing boat、passenger ship)充分考虑到背景、光照、视角、可见船体占比、尺度,以及遮挡情况的总共31455张图像数据。并且与目前学界公开的包含船只目标的其他样本库PASCAL VOC2007、CIFAR-10、Caltech-256进行对比,结果表明SeaShips在图像数量、目标个数、样本丰富性方面,都优于其他三个数据集。其次,本论文基于构建的SeaShips样本库,完成了三个基础实验:(1)实现三种基于深度学习的经典检测算法(Faster R-CNN、YOLO、SSD),全面总结该数据集用于船只检测的难点和挑战,对比不同检测算法的优缺点,为使用SeaShips数据集的研究者提供基础的研究结果;(2)结合实际应用,将训练得到的YOLO v2模型应用于现实的横琴环岛实时视频监控系统中,评估实时检测的效果,实现与无人机影像和GIS地图的联动;(3)实现基于卫星影像(顶视视角)的船只检测算法,并与自然图像的检测效果进行对比,总结其相同点和不同点。第三,本论文研究了深度学习算法与传统算法结合的新问题:深度学习算法的特征抽象,可解释性差;传统设计的特征速度较慢,但易于理解。针对此问题,本论文设计了一种用于提取船只目标独特特征的描述子S-TG,并提出了一种融合专家知识特征和卷积神经网络特征的网络模型SFFN,用S-TG特征描述算子约束卷积神经网络的反向传播过程。在SeaShips船只图像样本库中,SFFN模型表现良好,可以改善船只遮挡情况下的检测结果。本论文的前两项成果已经发表论文两篇,第一篇SCI发表于IEEE Transactions on Multimedia,题目为“SeaShips:A Large-Scale Precisely Annotated Dataset for Ship Detection”,本人为第二作者和通讯作者;第二篇中文核心发表于《地理空间信息》,题目为“基于YOLOv2的船只检测算法及其在横琴环岛监控系统中的应用”,本人为第一作者。第三项成果正在不断改进中。