【摘 要】
:
航拍图像的目标检测是计算机视觉研究领域的前沿课题之一,在诸如城市土地使用类型分析,交通监测和农作物生长监测等领域都取得了广泛应用。目前应用最广泛的目标检测方法大多都基于深度学习,其中又根据是否使用一系列预先铺设好的锚框(Anchor)分为Anchor-Based和Anchor-Free两种类型,常见的Faster-RCNN、Cascade-RCNN等都属于Anchor-Based一类。最近兴起的A
论文部分内容阅读
航拍图像的目标检测是计算机视觉研究领域的前沿课题之一,在诸如城市土地使用类型分析,交通监测和农作物生长监测等领域都取得了广泛应用。目前应用最广泛的目标检测方法大多都基于深度学习,其中又根据是否使用一系列预先铺设好的锚框(Anchor)分为Anchor-Based和Anchor-Free两种类型,常见的Faster-RCNN、Cascade-RCNN等都属于Anchor-Based一类。最近兴起的Anchor-Free方法,通过确定物体中心或者直接对边框的预测在单阶段检测器上达到甚至超过了Anchor-Based方法的效果,并大大减少了超参数的设置,但是Anchor-Free算法也存在正负样本比例差距较大、模型训练较难等问题,并且航拍图像本身存在着毕竟复杂多样、小目标物体占比高和目标分布较为密集等现象。针对以上问题,本文将针对Anchor-Free算法在航拍图像目标检测领域进行研究,并针对性的提出了一些改进措施,本文的主要工作如下:(1)实验并且分析了Corner Net和Center Net等常见的Anchor-Free在DOTA数据集中的效果差异,并与Anchor-Based系列方法进行对比,实验发现Anchor-Free检测算法在检测指标上与Anchor-Based可以相比较,并且以FCOS为代表的单阶段Anchor-Free算法在推理速度上有一定的优势,保证了算法的性能和速度之间的一个平衡。(2)通过对Anchor-Free算法和Anchor-Based算法在航拍图像上检测性能的对比,发现Anchor-Free算法存在对复杂环境适应能力弱,检测性能指标不佳等问题,以FCOS模型为基础设计了新的模型FAMDCNet,主要改进是通过替换ResNeXt骨干网络、添加了以注意力机制为基础的GCB模块、引入改进的可形变卷积、GIoU loss以及soft-NMS后处理操作,使得模型能更好的关注待检测目标区域,提升检测性能,并进行了详细的消融实验和分析,结果发现替换骨干网络的方式对模型的提升效果最为明显,达到了2.8个m AP指标,GCB模块也在模型的基础上提升了0.5%改进的可分离卷积DCN v2也提升了0.5个点的模型效果,加入GIo U损失函数也在前面的基础上提升了0.3%的检测效果模型,并最终提升了4.1%的检测指标,说明提出的模型是切实可行的。
其他文献
近年来,随着车联网和无线技术的发展,车载信息娱乐应用的不断涌现,车联网中内容需求也正以惊人的速度增长。为了满足车联网中如此高的内容需求,边缘缓存技术得到了广泛的关注。通过在网络边缘,如基站和路侧单元上部署缓存资源,在边缘节点上缓存部分流行内容以提供内容下载服务,能够有效缓解核心网络压力,减少内容请求时延。然而,由于边缘节点缓存资源有限、内容请求分布不均匀以及车辆高速移动导致网络拓扑动态变化等问题,
图像融合是图像处理领域中的一个重要分支,可以将来自不同的传感器对于同一场景中的信息采集后得到的图像数据进行处理,保留各自数据中的有用信息并剔除掉冗余的信息,得到含有集成信息的高质量图像。图像融合在军用和民用领域都发挥着重要的作用。深度学习目前发展势头迅猛,在图像处理领域具有非常广泛的应用,但是在图像融合领域,深度学习方法对比传统方法并没有明显的优势,原因主要有两点:一、图像融合领域没有绝对意义上最
近年来,利用深度神经网络(Deep Neural Networks,DNNs)进行医学图像分割取得了显著的进展。然而,深度神经网络通常需要大量的数据和标注进行训练,对于医学图像,图像采集设备及患者隐私等问题导致数据与标注都代价高昂且难以获取。为解决此问题,本文提出了一种基于距离度量学习(Distance Metric Learning,DML)的小样本(单样本和少样本)医学图像通用分割框架。现有的
计算机断层成像(Computed Tomography,CT)是一种通过X射线扫描待成像物体并采集投影数据实现内部结构成像的技术。由于X射线对人体健康的危害大,近年来,学者们研究利用传统CT重建方法基于稀疏角度X光重建CT,进而降低X射线使用剂量,但是在两个角度的重建中无法生成可理解的断层图像。而基于深度学习的图像重建方法对X光在二维空间的变化提取能力有限,且不同角度的重建结果不一致。本文通过分析
随着多媒体技术的不断发展和进步,以视频监控、远程会议和高清电视为代表的视频应用在人们的生产生活中发挥着重要的作用。然而由于当前计算机和网络系统中传输带宽、存储空间、系统输入输出性能等因素的种种限制,很多视频系统普遍存在着分辨率较低和图像质量差的问题。为了提升视频帧的图像分辨率和整体质量,视频超分辨率技术受到越来越多研究者的关注。视频超分辨率旨在通过对低分辨率视频进行一系列技术处理,增加其像素密度并
随着市场经济与科学技术的迅速发展,在人工智能的强大引擎驱动下,井喷式的出现了大量的机器学习应用场景。而监督学习表现良好则需要大量的有标签的标注数据,该任务开销庞大且繁琐无聊,故迁移学习在智能时代受到越来越多的关注。在迁移学习的相关技术中,多源领域自适应是重要的关键技术之一。多源领域自适应研究如何通过利用多个源领域知识学习目标领域,加强领域自适应能力,缓解了负向迁移。近年来,得益于人工智能和计算机视
近年来,通过计算机视觉的方法对目标物体表面进行三维重建一直是研究热点。本文以市场上常见的激光双目三维成像系统为研究对象,对该系统中涉及的关键技术:立体匹配和点云拼接,展开深入的研究,提出了重建过程中的关键步骤的优化思路,并根据优化的思路方法设计了针对性的实验来验证算法的有效性。具体来说,在立体匹配的激光光条中心提取的阶段,提出了利用方向模板的方法来优化灰度重心法在激光光条走向变化较大时的光条中心提
纳米电介质是一种具有性能可编辑潜力的新型电介质,其通过在聚合物基中均匀填充纳米颗粒可以获得优异的介电特性,被认为是未来最有潜力的电介质材料。然而,纳米填料团聚会导致纳米电介质无法达到预期的性能,甚至导致纳米电介质性能的严重退化。目前,团聚对材料的影响程度很难量化,是一个亟待解决的难题。使用扫描电子显微镜(SEM)拍摄纳米电介质图像并进行处理是一种分析团聚现象的有效手段。然而,受限于该领域图像处理的
叶面积指数(Leaf Area Index,LAI)是衡量植物生长状况的一个重要参数。它也是农业科学、生态科学、遥感科学中众多数学模型的基本参数。叶面积指数(LAI)控制着水、营养和碳循环中的许多生物和物理过程,被定义为单位地表面积的单侧绿叶面积。针对当前主流的LAI间接测量法具有误差大,精度低,稳定性低等缺点。本课题基于摄影法,将计算机视觉技术应用到LAI测量中,开展从单视角顶视法和多视角精确构
视觉定位技术作为移动机器人自主导航的核心技术,在赋能空间位置感知方面有着重要的价值。不对环境做任何限制,只依靠运动目标携带的相机就可实现定位功能的特点,使得视觉定位系统可广泛地应用于国防领域、航空航天领域、工业领域、日常生活等场景。尤其对于卫星信号缺失,有源定位无法部署或大范围覆盖的复杂环境,视觉定位更是凭借应用场景丰富,载体类型不限,成本可控的优点,在工业界和学术界引起了广泛的兴趣。视觉里程计(