面向航拍图像的目标检测算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sgqeye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无人机与航拍技术的迅速发展,基于无人机航拍的智能系统被越来越广泛地应用到各个领域,例如安保监控、交通管理、搜索救援等。检测航拍图像中的目标是这些智能系统的重要基础环节。近年来基于卷积神经网络的检测器在通用目标检测任务中取得了显著的成绩,然而航拍图像中目标的尺度变化范围更大且小尺度目标数量占比更多,与一般场景图像相比更具挑战性。本文分析了现有检测器存在的主要问题,提出相应的改进措施,设计并实现了单阶段无锚点检测器,取得较好检测精度。本文的主要工作包括以下部分:(1)现有的特征金字塔构建方法未能平衡地融合主干网络多层特征,本文基于尺度扩展特征聚合网络构建特征金字塔的框架,能够平衡地融合主干网络信息的多层特征,使特征金字塔能够提供表征能力更强大的特征,提高目标检测精度。通过在Vis Drone2018数据集上进行的消融实验,本文证明所提出的尺度扩展特征聚合网络能够有效地提高检测精度,相比基准检测器平均精度(Average Precision,AP)提高了4.9%。(2)在多尺度特征融合过程中需要使用上采样方法改变特征图的长宽,而现有的上采样方法不够高效。本文提出基于学习的级联上采样方法,在Vis Drone2018数据集上的实验表明,本文提出的级联上采样方法能够有效地提升检测精度,相比双线性插值方法检测精度提高1.4%AP。(3)基于锚点的检测网络其锚点超参数调优困难,锚点框数量过多导致模型参数量过多、计算开销过大。本文采用无锚点检测子网络,无需进行锚点超参数调优,通过减少模型的参数量降低了计算开销。实验结果显示,与基于锚点的检测器相比,在Vis Drone2018、UAVDT和DIOR数据集上检测精度分别提高1.3%、0.5%和1.0%。并且在Nvidia GTX 1080Ti显卡上的推断速度达到11.8 FPS,相比基于锚点的检测器提高1.2FPS。
其他文献
基于迭代函数系(Iterated Function System,IFS)的理论,Barnsley于1986年提出了分形插值函数(Fractal Interpolation Function,FIF)的概念以及构造方法.传统的插值方法产生的插值函数通常是光滑的或逐段光滑的,它们在拟合非光滑、不规则的现象和事物时显得乏力.而分形插值函数是不规则的,且具有很强的灵活性,因而成为刻画具有自相似性的事物和
2006年以来,P2P网络借贷服务在全球范围内兴起并得到快速发展。P2P网络借贷平台的兴起,其实质是现代互联网技术与当下社会资金借贷需求的高度结合。其立足于互联网影响范围广
在游戏智能体行为控制方面,目前国际上采用人工智能作为控制手段已存在不少。Open AI研究结果表明,特定的进化策略在训练大型神经网络时要优于原本使用基于梯度下降方法的训
长期以来,我国三家移动通信运营商通过对销售手机给予话费补贴的促销方式吸引消费者、争夺用户,并通过短期的补贴带来长期的收益。2014年7月8日,国资委已向中国移动、中国联通、中国电信下发通知(业内称之为“降本令”),要求三家公司在未来三年内,每年降低20%的营销费用。作为回应,三家运营商逐渐降低对手机终端销售的补贴。在失去补贴后,三家运营商旗下的终端公司失去了其存在的核心资源,反而成了手机厂商在渠道
本论文通过进化算法USPEX结合密度泛函理论PAW-PBE对Al6CMn(M=Li,Na,K;n=2,4,6)团簇的低能异构体进行了全局搜索。利用密度泛函理论B3LYP和组态相互作用QCISD方法对这些低能结
增大望远镜的口径能提高望远镜的成像分辨率和集光能力。自1609年伽利略发明世界上首台望远镜诞生以来,不断增大望远镜的口径成为人们坚定不渝的追求。由于加工能力的限制,目
公司机会原则是信义义务的一个具体规则,该原则适用的关键是对“属于公司的商业机会”进行认定。本文从中国和美国的两起最新典型案例入手,通过梳理裁判的事实、说理和关键要
在云计算大数据时代背景下,各行业信息化建设水平的提高和普及,促进了IT运维需求的增长。伴随着IT技术的进步,用户的业务向云端迁移带来整个IT行业的变化,也使传统IT运维出现瓶颈,为了顺应市场变化,更好地为用户提供服务,确保自己在竞争中的有利地位,IT运维进行转型升级是必然趋势。F公司是专业从事传统IT运维服务的公司,在向IT运维转型升级的转变过程中,公司原有的采购流程、采购策略、供应商的管理暴露问
由于我国分业经营分业监管的模式,资产证券化业务在我国区分为信贷资产证券化和企业资产证券化,前者发展迅猛,且各方面制度都比较成熟,后者受制于金融危机的影响而起步较晚,
随着医学成像技术的发展和计算机运算能力的提高,三维医学图像分割成为重要的研究方向。但是,受限于医学成像原理或机制的约束,以及人体器官与结构外形的复杂性,三维医学图像分割仍面临巨大的挑战。传统意义上的三维医学图像分割都是基于二维图像逐帧分割之后再重建出三维分割结果,由于无法利用相邻帧间的结构信息,分割不准确且耗费时间。已有的直接在三维空间进行的分割技术,例如CAVASS、MITK等三维图像分析软件、