基于CNN的航空图像目标检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:godwin82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航空图像目标检测作为计算机视觉目标检测的分支领域,不仅能够应用在军事侦察、导弹制导、无人机武器系统等国防领域,而且能够应用在交通监控、资源探测、环境监测、城市规划等民生领域。航空图像具有视场变化大、旋转变化大、背景复杂等特点,航空图像目标检测任务具有目标尺度变化大、目标疏密变化大、目标重叠、遮挡等难点。在研究现状下,当前基于CNN(Convolutional Neural Network)的航空图像目标检测算法对检测难点问题解决的不够充分,而且未考虑算法对计算资源的消耗与图像处理的实时性,也未考虑算法在实际应用中的适应性。因此,本文针对航空图像目标检测任务中的难点,并考虑算法在实际应用中的适应性,提出四级复杂度的航空图像目标检测算法。在此基础上以机载电脑作为算法工程应用的部署对象,通过对机载电脑计算资源与算法实时性的分析,选定并优化满足条件的检测模型。再将优化后的算法模型与无人机平台结合,设计并实现了四旋翼无人机目标检测原型系统,实现了航空图像目标检测算法的落地应用。首先,本文针对航空图像中目标尺度、疏密变化大,目标重叠、遮挡等情况使得图像中目标难以充分检测的问题,以YOLOv5为基础算法,采用复合扩张骨干网络的深度、宽度的方法构建四级复杂度的骨干网络,将骨干网络分别与FPN+PAN网络、输出头网络结合,再由数据集训练使网络模型收敛得到四级复杂度航空图像目标检测算法ATDNet(Aerial image target detection network),为在实际应用中平衡检测精确度、检测速度、模型复杂度提供了选择空间。其次,以机载电脑Manifold 2-G作为工程应用的部署对象,通过对机载电脑计算资源的分析与四级复杂度航空图像目标检测算法实时性的分析,选定了满足约束条件的检测模型。随后对该检测模型在先验框设置、多任务损失、推断过程这3个方面进行优化,其中先验框优化与多任务损失优化的结合,提升了模型对多尺度目标的检测能力,将模型的m AP@[.5:.95]提升了0.65%,m AP@0.75提升了1.41%。推断过程优化缓解了模型对重叠度较高的边框的错误抑制,有效改善对密集、重叠目标的检测。最后,针对城市道路场景下的目标检测任务,设计并实现了四旋翼无人机目标检测系统,实现了航空图像目标检测算法的落地应用,并在多个应用案例中验证四旋翼无人机目标检测系统的实用性与可靠性。
其他文献
食道癌作为生活中常见的一种癌症,其发病率和致死率都已经排在靠前的位置。当前诊断食道癌的影像主要有电子胃镜、超声内镜、计算机断层扫描、核磁共振等。医生在分析医疗影像时依赖于经验和专业技术,在诊断工作中容易出现耗时费力、精确度不高等问题。为了提升食道癌的确诊率,保障患者的生命健康,急需一种高效快捷的方式来辅助医生进行诊断。深度学习在图像处理领域已经取得了良好的成绩,它能够有效地对图像进行识别、分类以及
交通驾驶环境是一个复杂多变的动态场景,信息错综复杂。经验丰富的驾驶员受人的视觉选择性注意机制影响,能从大量的交通场景信息中迅速搜索到对驾驶任务重要的关键信息,分析并做出预判,保证行车安全。近年来,交通场景的视觉显著性检测技术越来越受到人们的重视。通过分析驾驶员的注意分布,并对其进行建模,从而预测驾驶场景中显著性区域和目标。目前,大多数研究都是针对白天交通场景的预测,然而,由于光线不足、光源干扰,夜
对于介观系统的输运性质,无序在量子自旋霍尔系统、三维强拓扑绝缘体和超导体、分数量子霍尔系统和弱AIII拓扑绝缘体中起着重要的作用,它可以导致金属-绝缘体相变并驱动拓扑相变。杂质的浓度对量子输运有很大的影响。在某些情况下,它们的微小变化会显著改变电导值。因此,有必要进行大量的数值计算来研究杂质能量和杂质浓度对输运性质的影响。本文希望通过流行的机器学习技术来降低这方面的计算成本。并研究利用机器学习方法
得益于科学技术的突破发展和迅速普及,无人车的应用面越来越广,给山地侦查和勘探提供了更加智能的手段,但是山地环境复杂,海拔变化大,气候条件恶劣,如何保证无人车能够快速准确地行进,完成任务是基本的要求。本文从路径规划以及强化学习方法研究现状入手,对环境建模、基于深度强化学习方法的全局路径规划、基于人工势场法的局部路径规划所涉及的相关技术原理进行了介绍,完成基于环境的无人车避障路径规划系统设计与功能实现
循环神经网络(Recurrent Neural Networks,RNN)是一个简洁高效的非线性通用模型,加上时间元素之后,能有效地处理动态系统(包括时间序列)问题。在实践中,RNN的网络结构(包括反馈位置,隐藏层神经元个数,激活函数等)通常需要人为预先确定,这要求丰富的经验或者繁琐的反复实验;另外,RNN的权值参数优化一直是基于梯度方法的,梯度消失和梯度爆炸问题表现得尤为突出,这些都导致了RNN
音乐源分离是将音乐不同的音轨分离成不同的音频,比如人声源和伴奏源。在标准的单通道混合音乐下,音乐源分离系统的性能已经达到了一定的瓶颈。如何提高在该条件下的系统性能,促进大规模音乐源分离技术的应用推广,这是一个重要的挑战。据此,本文研究基于深度卷积神经网络的音乐源分离模型,设计并实现一套可供用户分离音乐提取人声和伴奏的软件系统,其贡献如下:(1)针对单阶段编码器-解码器网络模型,提出了一种基于二阶段
对于脑肿瘤核磁共振图像进行分割是对其进行更好的医疗诊断和治疗规划必不可少的步骤。现有的以3D U-net为代表基于深度学习的分割模型尽管能够达到较为准确的分割,但依然存在一些问题:首先3D U-net对于脑肿瘤本身的特性利用不够充分,精度仍然有上升的空间;其次对算力资源有较高的要求,结构上存在一些缺陷。针对以上的理由,本文的工作主要围绕如何提高脑肿瘤分割精度进行展开,同时缓解3D模型对于算力资源的
随着抑郁症日渐成为社会关注的焦点问题,在早期可治愈阶段正确诊断抑郁症成为医学研究的一大热点和难点。核磁共振因其成像参数多、扫描速度快、组织分辨率高和图像更清晰等优点,在检测早期病变方面具有独特优势,已经成为肿瘤、心脏病及脑血管疾病早期筛查的有力工具,近年来在抑郁症研究方面也有广泛应用。如何提升分类的性能一直是将机器学习算法应用于抑郁症筛查问题的研究热点。本文借鉴现有的研究成果,针对传统机器学习算法
推荐系统可以为用户提供感兴趣的推荐项目,在互联网应用中起到重要作用。而图神经网络作为一种新兴的图表示学习方法,可以基于图的结构为用户和项目生成低维特征表示,进而为推荐系统提供包含节点邻居结构信息的特征输入。因此,基于图神经网络的推荐系统具有重要的研究价值和应用前景。近年来,针对图神经网络在推荐系统中的应用研究成果颇多,但其中不少方法仍然存在下列问题:1.针对邻居节点的均匀采样方法可能会忽略掉重要邻
情绪识别研究对于理解掌握人体的情绪状态至关重要,目前已在人机交互、远程教育以及医疗保健等领域得到广泛应用。随着情绪相关信号如文本、脑电等采集设备的发展,如何有效提取信号的情绪特征,提高情绪识别准确率是亟须解决的研究问题。本文提出基于文本、脑电和多模态融合的情绪识别研究模型,改进不同场景下的情绪识别方法模型,设计实现基于情绪监测的高血压管理系统。论文工作内容如下:1.针对文本情绪识别词嵌入缺乏句子上