论文部分内容阅读
伴随着成像设备的更新换代和航拍技术的迅速发展,人们捕获了大量的高清航拍图像,随之而来的是新的检测任务,即如何有效、快速地检测并识别出航拍图像中的特定目标。航拍目标的检测和识别在军事、民用等领域发挥着至关重要的作用。然而,航拍图像具有如图像尺寸过大、小目标众多、目标尺度多样化、背景复杂、宽高比差异大、目标排列紧密等特点,给检测带来了困难,使得基于通用目标设计的深度检测模型对航拍目标的检测效果并不理想。本文收集和构建了多种航拍图像数据集,对多类别航拍目标的检测与识别以及舰船检测问题展开深入研究,有针对性地改进了检测模型,融合了图像的多线索信息。研究内容和主要贡献包括以下几个方面:第一,提出了基于多线索融合的特征金字塔网络的航拍目标检测与识别(Multi-Cue Fusion based Feature Pyramid Network,MCF-FPN)。针对航拍图像中小目标众多、目标尺度多样化的问题,本文充分利用图像的多尺度特征线索,引入特征金字塔网络,实现了对多类别航拍目标数据集DOTA中的多尺度目标的检测。通过瓶颈模块、可变形卷积模块等获取各个特征层上的语义信息,用于更好地检测和识别,减少复杂背景的干扰。此外,针对航拍目标排列紧密的问题,本文提出了类别敏感的soft-NMS算法,并利用图像金字塔的思想,通过多尺度测试策略将图像的多尺度信息作为线索进行融合,进一步提高每个类别目标的检测精度。实验结果表明,在DOTA数据集上,MCF-FPN可以有效提升DOTA中的每个类别的检测率,与当前基于特征金字塔网络(Feature Pyramid Network,FPN)的改进算法具有可比性。第二,提出了基于多尺度感受野的R-CNN网络的航拍目标检测与识别(Multi-scale Receptive Field based R-CNN,MRF R-CNN)。为了提升基于深度模型的目标检测算法对航拍目标的检测速度,本文将Light-Head R-CNN网络用于航拍目标的检测,并针对航拍目标尺度多样化的问题,设计和融合了具有不同感受野的特征图作为特征线索来提升网络的尺度不变性。本文将图像的多尺度信息作为线索,在测试时进一步融合,提升网络在DOTA数据集上的检测精度。实验结果表明,在DOTA数据集上,与当前基于R-FCN改进的目标检测算法相比,MRF R-CNN的检测精度更高,在小目标的检测效果上尤为显著,检测速度也更快。本文将模型在含小目标较多的航拍舰船数据集Kaggle上进行测试,进一步验证了模型的鲁棒性和泛化性。第三,提出了基于特征选择的Det.Net 59网络的海面舰船检测。为了快速而有效地检测和识别海面上的军舰和民船目标,本文将IIR_SC数据集作为研究对象,将Det.Net59网络用于海面军舰、民船的检测。通过在Det.Net59网络中引入特征注意力机制,针对性地选择和融合特征线索,并将感兴趣区域池化层替换为感兴趣区域对齐层,提升了模型对海面舰船的检测精度。实验结果表明,本文提出的轻快的模型能将检测速度提升到约每秒50帧的速度,达到实时。