基于深度学习的无人机影像中小目标检测方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lv_dan1102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测通俗来说,便是找出图像中指定的目标,同时需要找出目标位置和大小。目标检测的根本内容便是“什么目标在哪里”。对于小目标的定义一般有两种,一种是COCO数据集[1]中定义的,物体像素值小于32×32,另一种定义方式是目标的宽和高均在原图十分之一以下,满足以上两种条件之一,则定义为小目标。随着科技的发展,高分辨率航拍图像可用性越来越高,其中包含了大量安全、土地开发、疾病控制、缺陷本地化、监视等相关信息。但是,这些数据是高度非结构化的,因此很难从大规模的数据中提取有用的信息,甚至需要密集的手工分析。例如,对于城市土地进行分类这一工作,需要专业人员来操作。因此,这项任务必然效率低下并且价格昂贵的。而无人机影像中的目标大多都是小目标,为了将深度学习使用到无人机影像的小目标检测中,本文选择了开源数据集Vis Drone作为训练集。针对无人机影像中小目标检测的难点以及数据集中存在的难点,本文提出了改进的方法。本文主要从以下几个方面开展工作:(1)本文针对目标检测模型中对于小目标存在定位不准的情况,设计了注意力机制。本文的自注意力机制十分灵活,可以灵活融合到其他检测模型中。并在一阶段和二阶段的方法中验证了本文注意力机制的有效性。(2)本文针对无人机影像中存在的光线明暗变化,导致小目标检测困难的问题,提出了特定的数据增强操作(对目标进行随即旋转,对小目标进行放大,随即增加噪声,调节光照和对比度)进行解决。(3)针对目标检测模型中人为设定Anchor大小常常与数据集中小目标不匹配的问题,本文提出了使用Anchor自适应生成方法,使得生成的Anchor大小更匹配当前数据集,来提升小目标检测精度。(4)针对这边对于现实世界中普遍的样本不平衡和类别不平衡问题,本文提出调整损失函数的方法,使用focal loss来改善数据集中的样本不平衡问题。(5)针对目标检测数据集中普遍存在的检测框重叠现象,本文提出使用Softer-NMS策略来解决该问题。本文基于VisDrone数据集,根据本文所提出的模块做了充分的实验,验证了本文所提出的各个改进方案对于无人机影像中小目标检测的难点的帮助。
其他文献
深度模型性能提升的同时,模型参数增加、内存使用资源增加、训练时间过长、计算量过大等问题接踵而至。这些问题使得嵌入式设备、集成设备等资源受限机器无法正常使用,从而影响深度学习的应用推广。在此背景和市场需求下,针对模型压缩方法的研究具有重要意义,知识蒸馏是一种近几年来被广泛关注的模型轻量化方法,学生模型通过模仿教师模型进行训练。学生网络模型在教师网络模型的指导下,可以更好地学习数据集中的结构化知识。基
近年来,电力系统自动化、信息化及智能化发展水平显著提升,许多新技术应用到传统电力系统中。轨道交通电力数据采集与监视控制(Supervisory Control And Data Acquisition,SCADA)系统和其他电力系统类似,有着强烈的稳定性、容错性和可靠性需求。恰逢成都轨道交通电力SCADA系统智慧维保科研项目立项,本文借此契机以轨道交通电力SCADA系统的状态估计功能作为出发点,改
随着容器技术和Kubernetes的兴起,全球众多的云厂商纷纷推出属于自己的容器云服务。容器技术的浪潮从Docker的普及开始,直到Kubernetes的逐渐成熟才真正的落地,才开始真正实现从传统的应用部署管理模式向容器服务模式转变。2020双11期间,阿里已经将80%的核心业务部署到容器云平台当中,Google更是已经在生产环境当中积累了数十年的容器服务经验,而Kubernetes正是其开源的容
近年来,网络安全问题不断增加,这导致了网络的控制和管理面临越发严峻的形势。为了应对网络不安全因素的威胁,网络管理人员亟需一种有效的手段来加强对网络的安全控制和管理。网络脆弱性分析是预防网络攻击发生方法的重要一环,能够帮助网络管理人员建立完备有效的网络控制和管理机制,同时也是网络科学领域的研究热点问题之一。网络中的高风险节点指在网络中影响力高,但防御力低的节点,这些节点是造成网络脆弱的重要因素。现有
自21世纪以来,随着芯片制造与设计工艺的快速发展,计算机的算力有了质的飞跃,因此机器学习科学取得了空前的应用,尤其是深度神经网络在各领域的应用。在使用传统的最优控制理论处理机器人控制问题时存在两个主要难点,其一是需要清楚的知道被控系统的行为模型;另外一点是模型需要精确的输入输出,使用函数估计器带来的误差很大程度上会导致控制模型的失效。强化学习则需要对每个函数都进行近似估计,通过近似估计实现对实际的
我国拥有相对较为丰富的水能资源,但水能资源利用率相对不足,通过对径流时间序列进行可靠的丰枯性预测可以协助决策供电方案,优化发电资源调配,从而提高水资源的利用率,同时对于防洪抗旱方案的制定都具备一定的指导意义。近年来,对于径流丰枯性预测的研究也取得了一些辉煌的成果,但是仍存在着以下需要解决的问题:(1)径流序列不具备明显规律性,需要进行序列分解,但是传统分解方法受端点值影响较大(2)现实中水文数据的
与完全公开了通信规约的已知协议不同,当今的网络中有着许许多多的未知协议,个人或者一些软件厂商考量到有关安全问题、经济利益甚至个人隐私等各种各样的问题,他们并没有选择将协议的细节部分公之于众。由于未知协议在实现和实际应用过程中可能存在各种类型的安全威胁,且在实际网络环境中,目前的网络安全设备多基于已知的协议报文格式进行检测和防护,导致未知协议在实际通信应用过程中面临着极大的安全威胁。分析其存在的安全
分类、定位、检测、分割是计算机视觉领域最核心的任务。近年来,卷积神经网络(CNNs)技术取得了瞩目的成就,促进了目标检测技术飞速发展,越来越成为人类生活的便捷工具,在智能安防、智慧医疗、自动驾驶等领域广泛应用。尽管基于深度学习的目标检测取得长足进步,但在检测不同大小的物体存在相当大的性能差异。小目标物体由于自身尺度问题,存在被遮挡,特征不明显等问题,导致小目标难以检测。因此,小目标检测的研究也逐渐
域适应(Domain Adaptation,DA)是迁移学习的一个分支,其目的是将知识从带标记的源域迁移到缺乏标记但任务相关的目标域,为借助已有的数据知识和节约模型训练的资源成本提供了有效途径。根据目标域数据的获取形式,域适应方法可分为离线域适应和在线域适应。现有的域适应研究大多针对目标域数据全部提前收集的离线域适应场景,它们提出的方法大多从特征层面上关注如何减少两域数据分布的差异,在知识迁移的过
随着大数据时代到来,问答系统作为一种能够高效获取有效信息的手段,引起了各行各业的广泛关注。在军事装备领域,大量的装备类型、型号以及参数信息等对指挥作战人员非常有用,但这些信息却未能得到有效利用。主要原因是现有的搜索引擎给出的查询结果数目过于繁多,相关工作人员无法迅速找到自身所需的信息。针对传统搜索引擎在装备领域存在的问题,本文基于军事装备数据,构建了一个契合用户的个性化问答系统。该系统采用模块化方