论文部分内容阅读
水下环境是一个复杂多变的场景,对于水下视频中的目标,使用基于传统视觉的目标检测算法很难得到一个好的检测结果,主要在于不能很好地提取到目标身上的有效特征。针对这个问题,本文采用了基于深度学习的目标检测算法来完成水下视频中的目标检测工作,并且取得了很好的检测效果。对于水下视频的目标检测与跟踪,本文采用的是先检测后跟踪的策略,先对第一帧图像使用深度学习的方法进行目标检测,目标检测算法使用的是Deformable R-FCN,并使用Soft-NMS对检测的结果进行后处理,然后在接下来的连续15帧图像中使用KCF算法进行目标跟踪过程,最后依次执行这个检测和跟踪的过程。本文的主要研究工作如下:1)对于水下视频中的目标检测,使用基于深度学习的方法,提高了目标检测的精度。基于传统视觉的目标检测算法存在很难提取到有效特征的问题,所以导致目标检测的准确率不高,而基于深度学习的目标检测算法能够自己去学习目标身上的特征。本文使用的目标检测算法是Deformable R-FCN,这是一种将可变形卷积网络和R-FCN相结合的目标检测算法,通过与SSD算法和R-FCN算法之间的对比,证明了本文使用的目标检测算法具有更高的检测精度,在本文所用的数据集中可以达到90%左右的准确率。2)对现有的特征提取网络进行改进,使得目标检测具有较高检测精度的同时,还有很高的检测速度。Deformable R-FCN算法尽管能够达到一个很高的检测精度,但是它的检测速度存在一个慢的问题,检测速度太慢会影响到整个水下视频的目标跟踪过程。为了提高Deformable R-FCN算法的检测速度,本文对使用的ResNet网络进行了改进,设计了一个22层的ResNet网络。通过与其他的ResNet网络对比,证明了本文设计的ResNet网络不仅对目标检测的精度影响不大,而且还对目标的检测速度具有较大的提高。3)使用KCF目标跟踪算法对目标检测结果进行跟踪。在使用深度学习的方法对目标进行检测完之后,尽管可以得到一个很好的检测结果,但是却存在着检测速度慢的一个问题,为了提高水下视频中目标检测与跟踪的整体速度,使用了目标跟踪的方法来进行图像检测后的后续处理。本文中使用的目标跟踪算法是KCF算法,KCF算法在本文的数据集上有很高的跟踪速度和准确率。