基于无人机航拍图像的目标检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:a0602141021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着目标检测和无人机领域的结合越来越密切,涌现出大量优秀的目标检测算法。无人机航拍图像数据集独有的特点,使得高精度和高速度均衡的目标检测算法成为研究的热点,本文对基于无人机航拍图像的目标检测算法进行探讨和改进,在基于YOLOV4网络基础上的相关改进和实验结果如下:1.针对图像边缘检测和图像填充问题,在输入端,本文设计了自适应图像输入和自适应图像缩放。图像输入使用Mosaic数据增强的方式,将四张输入图像随机缩放、拉伸、裁剪后随机排列在一起,处在图像边缘的目标能够有效的被检测,使得召回率和精度都有所提升,但每次输入的图像预处理降低了检测速度。图像缩放使用自适应方式填充最少黑边,显著地提升了推理速度。2.针对网络中通道信息交互和参数优化问题,在主干网络,本文研究并加入图像切片和深度可分离卷积。图像切片等间隔取出图像切片,并在通道上进行叠加,目的增加输入的通道信息交互,深度可分离卷积首先进行逐通道卷积而不进行通道之间的融合,然后使用1*1卷积核进行逐点卷积和通道融合,极大地减少了参数量,前者改进有效提升了检测精度,后者改进显著地提升了检测速度。3.针对多尺度检测和遮挡目标检测问题,在预测端,本文改进并增加了空洞卷积和排斥损失。由于模型输出预测的三部分分别负责小中大三类锚框,因此针对性使用扩张率为1、2、3的空洞卷积,去提升对应特征图的感受野,有效改进了对多尺度变化目标检测的效果。在回归位置损失部分加入排斥损失中的排斥项,加大预测框与背景和其他类别实际框之间的距离,提升了被遮挡目标的召回率,但由于损失函数的复杂化导致计算量增加,检测速度有所下降。结合考虑检测精度和速度,本文融合了除排斥损失外所有改进,得到了最有效的模型,在Vis Drone2019数据集上的训练结果,平均检测精度均值达到43.75%,平均召回率达到57.13%,检测速度达到151FPS,在召回率和检测速度远远超过数据集公开的最佳算法。本文分析了模型训练时损失函数的下降曲线,验证了改进算法的有效性。并在测试数据集上进行了测试实验,从输出的检测效果图验证了改进算法的实用性。
其他文献
目标跟踪是计算机视觉的一个重要分支,在现代科技社会建设中起着举足轻重的作用,而红外场景下的目标跟踪常常应用在军事场景中,利用红外探测技术可以提前发现并锁定敌人的军事目标。本论文中的多目标密集场景下的红外成像视觉跟踪技术,要求对多个红外目标进行跟踪,且目标往往呈现为红外弱小状态,缺乏显著的颜色、纹理以及形状特征,而在跟踪中目标特征的提取十分关键,因此弱小目标的特征表示是小目标跟踪中的一大难题。另一方
目标检测是计算机视觉中的一项基础研究任务,试图解决图片中什么目标在哪里的问题,而复杂背景下的目标检测则进一步强调了此任务下场景、环境的多样性和困难性。目前,各种目标检测算法众多,并且已在自动驾驶、安防等领域得到了良好的落地应用,然而,应用越广对算法的可靠性要求也越高,但算法模型从大量的公共数据集中所学的特征分布并不能完全涵盖生活实际场景,在面临目标重叠拥挤、尺度的变化、光线变化等问题时,算法的性能
随着计算机视觉技术的发展,仅预测目标类别和位置的目标检测无法满足人们对人工智能系统日益提高的需求。复杂场景下多目标及其属性检测在智能可穿戴设备、机器人、自动驾驶等领域拥有更好的应用前景,本文主要研究基于深度学习的高效多目标及其属性检测算法,构建多目标及其属性检测数据集,以特征共享、多头注意力、特征提取模块等角度解决复杂场景下高效多目标及其属性检测问题。本文主要研究内容如下:(1)本文构建了适合复杂
图像识别是计算机视觉领域最基础的研究方向之一,随着深度学习的不断发展以及卷积神经网络的大规模应用,通用图像识别任务的处理方法日臻完善,因此越来越多的研究者将目光投向更加细分的领域,细粒度图像识别问题就是其中一个热门的分支,在细粒度图像识别分析领域,通用的网络模型已经不能很好的满足任务需求,同时这一领域还在不断发展,越来越多的研究课题正在逐渐向现实生活中的实际问题靠拢。本文针对时尚领域的细粒度图像提
镍是我国不可缺少的战略金属。镍冶炼行业主要采用硫化镍阳极电解精炼工艺生产镍产品。在镍电解精炼生产过程中,发现和消除镍电解槽中铜棒异常发热/断路故障以及阴极补液口水流堵塞状况,是镍电解生产过程管理的重要内容之一。目前,国内镍电解行业内仍然采用人工巡检的方式阴阳极铜棒状况和循环管新液畅通状况,工作量大,劳动强度高。因此实现在镍电解生产现场的自动化检测,及时对镍电解过程中的故障进行预警,能够有效降低人力
静电放电(Electrostatic Discharge,ESD)软失效是一种因积聚的静电荷对电子设备放电导致电子设备出现非永久性故障的现象。ESD软失效一般可以通过程序自动介入或人为干预使设备性能恢复正常,但这也造成ESD软失效难以追踪放电电流、耦合路径和故障根因。随着智能手机和可穿戴设备等便携式移动电子设备的普及,系统级层面的ESD软失效现象出现的次数日益增多,严重影响了便携式移动电子设备的体
机器人系统自出现以来便得到了长足的发展与大量的研究,机器人系统由机器人和作业对象及环境共同组成,不准确的测量和建模,外界条件及测量误差或其他原因,都会使建立准确的动力学模型变得困难。本论文研究的基本出发点是基于不确定机器人系统的控制。对机器人控制而言,基本要求之一是提高机器人与环境的交互性能,使其在与各种环境进行稳定交互的同时能以灵活的方式进行。所以,为提高在不同环境下不确定机器人系统的人机交互性
癫痫是一种常见的神经系统疾病,该疾病在各个年龄段都会发生。癫痫不光会给患者带来身体上的痛苦,还给患者及其家人的生活带来巨大的负担。目前,癫痫检测仍然是通过医护人员观测脑电图(Electroencephalogram,EEG)来实现。但是,这一过程耗时长且消耗精力,会给医护人员带来巨大的工作负担。因此,实现癫痫的自动检测变得尤为重要。在当前癫痫检测的研究之中,虽然许多的特征提取方法被提出,但是这些特
随着集成电路芯片中数模混合电路的比例进一步扩大,导致行业对混合集成电路测试系统的需求迫切。混合集成电路测试系统是用于测试芯片电路功能、电特性,以及电学参数的自动测试设备。控制软件平台属于测试系统的软件组成之一,主要实现两个功能:(1)提供混合集成电路测试的测试程序开发界面,供用户完成测试程序、测试流程、测试参数的设置;(2)控制驱动软件实现芯片的测试,并获取测试结果。控制软件平台应该具备良好的通用
3D打印作为一项快速成型技术,其分层叠加的加工方式使其不必经过传统等材与减材加工的开模、铸造、切削等工序,大大降低了产品的研发成本和周期,同时也突破了复杂结构对加工过程的限制,被广泛应用于各个领域。3D打印中,模型需经过一系列数据处理过程转化为机器可识别代码进行实体打印,因此,数据处理过程对打印精度效率有着至关重要的影响。基于此,本文针对3D打印数据处理过程展开研究,重点关注分层算法和成型方向的优