基于深度学习的无人机图像目标检测算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:summerquaner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实现基于深度学习的无人机图像实时目标检测算法优化设计及部署,在军事国防、灾害检测、智慧城市等领域具有重要的应用价值。但由于高分辨率无人机图像具有不同类型目标尺度差异大、密集小目标分布广等特点,如何兼顾检测精度和实时性的需求,仍是亟需解决的重点问题之一。红外图像目标指示性好,但纹理特征缺乏,无人机视角红外图像目标检测数据集的缺乏,阻碍了相关研究的快速发展。将检测模型移植到嵌入式设备时,如何提高推理速度并降低检测精度损失,需结合具体的嵌入式设备进行优化。本文针对上述问题展开研究,主要工作内容如下:(1)为解决无人机视角下红外图像匮乏的难题,基于实验室自研的图像标注软件,构建了红外目标检测数据集Infrared-PV。基于无人机飞行习惯,在倾斜、移动视角以及变焦情况下,采用FLIR红外摄像机拍摄了黑热、白热和热力图三种模式下的视频序列,以抽帧方式构建的数据集共包含2138张图片及近十万个标注信息,目标类型为行人和车辆。在对数据集进行统计分析基础上,给出了典型的基于深度学习的目标检测算法的性能基准。设计了一种基于SwinTransformer主干网络的改进YOLOv5模型,平均精度均值达到了基准次优,实时性与YOLOv5算法相当。(2)针对无人机图像的特点,提出了基于YOLOv5的实时目标检测改进算法-YOLOv5sm+。首先,分析了网络宽度和深度对无人机图像目标检测性能的影响,基于可增大感受野的残差空洞卷积模块改进YOLOv5s网络,提高了空间特征的利用率,在不降低模型实时性的同时显著提高了检测精度。其次,通过对多尺度的特征进行跨阶段特征融合,提出了SCAM模块,提高了特征融合效率与中大目标的检测精度。最后,通过SDCM检测头解耦模块,缓解了分类和回归之间的互斥矛盾,进一步提高了检测性能。采用Vis Drone无人机航拍数据集进行算法验证,实验结果表明,平均精度均值较YOLOv5s模型提升4.8%,同时实时性优于YOLOv5m。在Infrard-PV红外数据集、DIOR遥感数据集上也验证了提出模型具有较好的鲁棒性。(3)考虑Jetson-Xavier硬件特点,对提出算法进行了优化部署。首先,基于半自治控制思想,提出了人在回路的模型裁剪算法Slim-HIL。通过引入非线性惩罚,提高模型训练过程中权重稀疏性,通过人工矫正的方式提高了模型裁剪的效率。其次,基于软硬件联合优化的思想,采用三种深度模型部署方案对提出的改进模型进行了部署,开发了嵌入式实时目标检测交互软件,在输入分辨率为1536×768的情况下达到了25FPS的推理速度,满足边缘设备上实时推理需求。
其他文献
近年来,深度学习受到广泛关注,但是也显露出一个缺点,即模型通常需要依赖大量的数据才能获得较好的性能,然而有时要获取这种数量的数据极为困难。因此,小样本学习逐渐成为计算机视觉领域重点关注的研究课题。基于这个背景,本文针对小样本学习中基于度量学习的原型网络算法展开研究,并在国际公开数据集上进行了实验。主要研究内容如下:(1)针对度量模块中样本均值特征对原型表示的贡献不均衡问题,提出了利用权重和转导来对
学位
建筑设计与园林景观设计有着非常密切的关系,通常在景观设计途中,建筑设计以人文特色以及艺术魅力的特点,极大地影响着景观设计的开展。所以,相关设计师需要了解大众对园林景观设计的真实需要,这样才能够展现出建筑设计的特殊性,最后达到景观设计和建筑设计两者之间的完美结合。在此基础上,概述了景观设计与建筑设计融合的现状及其相互关系,并研究了景观设计与建筑设计融合的措施。
期刊
LLC变换器由于具有高效率、高功率密度等优点已经成为了应用最广泛的电力电子变换器之一。目前大功率LED的驱动电源基本由PFC变换器和LLC变换器组成。LED驱动电源有两大要求,即高效率和宽调光范围。其中高效率保证了变换器产生的热量更少、温度更低,从而延长变换器的使用寿命;宽调光范围保证了LED的亮度能在较大的范围内变化,从而适应各种不同的照明场合。然而高效率和宽调光范围往往不兼容,通常LLC变换器
学位
颅内动脉粥样硬化性狭窄(ICAS)是导致缺血性卒中的重要原因之一。症状性ICAS有较高的卒中复发率,且与高加索人群相比,中国人群症状性ICAS患病率更高。中国血管成形及支架置入术治疗症状性重度颅内动脉狭窄(CASSISS)研究改进了研究设计方案,基于中国人群重新评估了血管内治疗ICAS的安全性和有效性,为ICAS的治疗提供了有力的证据。该文从循证医学证据、适应证选择、介入治疗手段以及未来的临床研究
期刊
随着机器视觉和机器人技术的迅速发展,越来越多搭载视觉功能的AGV应用到仓储物流行业,进行货物搬运工作。如何利用计算机视觉使得机器人在集中库位环境下,能实时感知每个库位的状态,从而保障在货物搬运过程中目标库位规划的合理性与有效性,同时使得空闲库位利用率最大化的研究具有重要的应用价值。因此,本文设计一种基于RGB相机的库位标定与检测系统,可在CPU与GPU端稳定运行,为AGV调度提供库位状态输入,进而
学位
近年来,图像字幕任务被用于处理大量视觉数据。但是图像字幕只能概括性描述图片整体内容,无法定位两张图片的差异。而随着视觉数据多样化,大量相似图片出现,急需一个能够定位差异并描述差异的模型,图像变化字幕应运而生。图像变化字幕近几年得到了广泛研究,但是现有模型定位变化区域算法精度不高以及解码视觉数据的网络结构简单,以至于无法准确的描述出两张图片的区别。对此,本文提出了两个模型,均致力提高定位变化区域算法
学位
本文主要以建筑设计与园林景观设计的融合方法为重点进行阐述,结合当下园林景观设计实际情况为依据,对建筑设计与园林景观设计的融合价值进行分析,同时研究内化建筑设计与园林景观设计的融合效果,进一步强化建筑设计和园林景观设计融合有效性与实效性,旨意在为相关研究提供参考资料。
期刊
目的:分析良性阵发性位置性眩晕(BPPV)患者的临床特点,比较联合手法复位和药物治疗组的治疗效果,对治疗BPPV的方法进行观察,且分析影响病情复发的危险因素,为临床治疗提供参考。方法:选取2015年7月-2016年7月在连云港市中医院门急诊接受治疗的BPPV患者124例,根据治疗方法不同,分为对照组和观察组各62例。整理所选患者的临床特征并分析,比较两种治疗方法患者的治疗效果以及复发率。根据是否复
学位
深度信息揭示了二维图像中物体间的空间几何关系,对许多计算机视觉任务都有重要意义,特别是对于场景理解有着关键作用。随着深度学习的发展,许多研究人员开始采用基于深度神经网络的方法代替主动传感器从单目图像中获取深度信息,并取得了一定的成果。然而,二维图像上的一个像素点可能对应三维空间中的无数个点,因此单目深度估计是一个具有挑战性的不适定问题。为了解决这一问题,本文提出两种以先验知识作为引导的算法,大幅提
学位
随着我国经济的持续发展,机动车数量不断增加,给人们提供了出行和货物运输上的极大便利,但同时也造成交通事故、道路拥塞、能源消耗过度和汽车废气污染等社会问题。自适应巡航控制(Adaptive Cruise Control,ACC)作为一种主动安全技术在避免交通事故和缓解交通拥堵等方面有重要作用。ACC系统的控制指标包括安全性、舒适性和燃油经济性等,系统性能受控制策略的影响较大,本文对ACC控制策略进行
学位