基于MLU100的遥感影像目标检测算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:X395381435
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,随着高分辨率对地观测卫星技术的快速发展,基于遥感影像的目标检测技术正逐步被广泛应用于军事观测、国土调查、灾害预防等活动中。同时,基于深度学习的目标检测算法凭借其卓越的性能已经成为目标检测领域的主流方法,研究证明基于卷积神经网络(Convolutional Neural Network,CNN)的YOLO系列单阶段目标检测算法在遥感数据集上具有较为优越的性能。但目前典型的计算平台CPU难以支撑其数以十亿计的浮点计算量,而国产人工智能芯片寒武纪MLU100作为一款特殊应用集成电路,在高能效且需求灵活的场景十分适合用作CNN的硬件加速器。本文针对遥感影像目标特点,结合寒武纪MLU100硬件架构特点对遥感影像目标检测展开研究。在YOLOv3算法的基础上针对性改进模型以提高对遥感目标的检测精度,并实现了算法和MLU100计算平台间的高效融合,最大化地提高了硬件资源利用率。论文主要工作及贡献如下:(1)提出了YOLOv3多阶段改进算法。在该算法中,提出锐化滤波注意力机制,由通道注意力、锐化滤波空间注意力模块和短路连接构成,增强目标边缘信息并抑制干扰特征;将VoVNet单连接思想引入骨干网中,使用单连接代替网络中的部分残差连接,不增加连接数量的同时增强层间信息的共享率;提出基于多支路空洞卷积的特征增强模块,有效增强特征提取网络的感受野,提高了骨干网络的特征提取能力;使用WBF候选框筛选算法代替传统的NMS算法,有效提高了预测框的位置精度。经过实验证明,相较于原始YOLOv3算法,这些改进分别将模型的平均检测精度(mean Average Precision,mAP)提升了1.4%、2.4%、2.1%及0.7%。(2)实现了改进算法在寒武纪MLU100硬件平台上的高效部署。通过Roofline模型分析了MLU100计算能力和改进YOLOv3模型性能,确定YOLOv3在MLU100平台上处于带宽瓶颈状态,通过前移注意力模块和特征增强模块提高MLU100的算力利用率;经过模型优化、模型训练、模型框架转换、算子移植、模型量化、在线和离线模式部署等步骤,将改进算法完整移植到寒武纪MLU100硬件平台上;在YOLOv3后处理算子移植过程中,使用数据划分策略实现了对MLU100片上内存的时分复用,降低了访存时间消耗;最后研究了算法在不同模型并行度、数据并行度下的执行效率。在本文收集整理的数据集上,实现了改进算法105 FPS的处理速度和68.1%的mAP。(3)在寒武纪MLU100硬件平台上设计并实现基于QT的遥感影像目标检测显示系统。该系统具备模型选择、图像视频检测和实时结果显示等功能,支持多种目标检测算法。使用图像预处理、算法推理、图像显示三个线程并行流水线处理图像或视频,充分利用CPU的多核处理能力和MLU100的计算性能,提高了目标检测算法的处理速度,实现了对遥感图像的高速检测和显示。
其他文献
目的 构建首个认知域信息传播的动力学理论模型以推动认知域信息攻防的体系建立,并利用仿真数学模型进行概念验证。方法 在理论构念上提出认知域信息传播的核心-易感-感染-康复传播动力学模型(Hub-Susceptible-Infected-Recovery, HSIR),基于龙格-库塔法的非线性积分方程进行模型仿真验证。结果 标准HSIR模型的仿真结果显示,认知域信息在1万人的群体中传播,将在第46天达
期刊
在碳减排的大环境下,大力发展再生能源对实现“双碳”目标具有十分重要的意义,而再生能源最大的消费主力之一就是电动汽车。电动汽车的核心之一是电池管理系统(Battery Management System,BMS),BMS主要的作用就是实时监控汽车的行驶状态,但目前BMS仍有不足,存在精度低、体积大等问题。由于锂电池估测系统对汽车行驶安全至关重要,因此开发了精度更高、体积更小的锂电池估测系统。论文研究
学位
随着计算机与互联网技术的深入发展,人类生活与互联网的结合愈发紧密。在这一态势下,计算机和互联网系统的安全性对于人类生活生产的稳定运行极其重要。然而自计算机软件诞生以来,代码漏洞就在影响着软件和系统的安全稳定。如何在软件开发和编译阶段就对代码漏洞进行检测,是软件技术发展中的关键环节。Go语言是一种兼具python的快捷开发特性和C语言的高性能和高安全性等特征的语言。Go语言的使用过程中同样有代码漏洞
学位
对于监控场景来说,摄像机的运动、环境光照等因素的变化相对可控,而物体剧烈运动是引起模糊核突变的主要原因。传统动态场景去模糊的方法都基于相邻帧之间的位移较小,适用于处理平滑变化的模糊核。而动态场景中通常包含多个运动物体,很容易发生模糊核突变的情况,在由粗到精的框架内传播时,模糊核突变会导致重构误差。本文针对双向光流去模糊方法中存在的微小结构重构失误导致伪影的现象,提出了一种对多尺度金字塔进行分层处理
学位
针对当前基于知识图谱的推荐模型没有充分挖掘知识图谱语义结构信息的问题,提出一种融合知识图谱表示学习方法和信息协同传播机制的推荐模型KCOD。KCOD基于经典的知识图谱表示学习模型DistMult与TransR建模并推理实体三元组的语义关系,然后通过交叉计算每一阶历史交互实体向量推理结果与候选物品实体向量推理结果的相似度,进行模型训练及偏好预测。实验结果显示KCOD的性能优于经典对比模型。
期刊
社交平台信息发布和获取的便捷性,方便了人们的沟通交流,但是也给谣言的产生和传播提供了肥沃的土壤。谣言一般产生于人们普遍关注的热点领域,极易引发各类不安定事件,影响社会和谐稳定。建立谣言传播模型,探究谣言传播影响因素,有助于治理谣言。现有的研究很少考虑到空间因素对谣言传播的影响、初始传播者不同的影响力以及通过优化网络结构治理谣言问题。借助分形理论,可以使谣言传播模型的研究更加完善。本文利用分形理论的
学位
互联网时代的到来,对人们的生活方式和思维观念产生了颠覆式的影响。同时也使传统行业发生了巨大的改变。计算广告因其得天独厚的优势,成为广告主要的投放模式,和传统的媒介不同,计算广告采用大数据和机器学习的相关技术,实现广告的精准投放,达到千人千面的个性化推荐效果。计算广告领域的核心问题是准确地预测用户对待预测商品的点击率,一个性能优秀的点击率预估模型不仅能为商家和平台增加收益,同时也能改善用户的体验。早
学位
近些年来卷积神经网络广泛应用于航天背景下在轨实时目标检测,同时FPGA由于其低功耗、高并行的特点,成为航天领域卷积神经网络算法最理想的载体。但随着深度卷积神经网络的发展,模型计算量参数量日益增长,FPGA有限的资源成为深度卷积神经网络部署的瓶颈。本文以此为切入点,参照超长指令字架构的设计思路,提出了基于FPGA的卷积神经网络算子复用式指令架构CNN-SISA,实现了资源的缩减及效率的提升,主要工作
学位
随着无人机任务环境的日益复杂,通过多无人机协同执行任务的方式逐渐成为无人机应用的主流趋势。考虑到任务的复杂性和繁重性、无人机的自身性能限制、多无人机之间的约束以及任务环境的不确定性,研究一种高效的多无人机协同任务规划方法有着重要意义。在任务执行场景的设计中,对相关场景的建模需要与现实场景相结合,从而保证后续工作可在实际场景中应用。多无人机协同规划首先要完成对多无人机任务的分配,但由于任务环境中存在
学位
随着三维扫描技术的迅速发展,高分辨率和高保真度的点云模型在自动驾驶、计算机视觉、生物医学等方面的应用越来越普及。为了更真实地刻画三维场景或物体的几何与表面纹理信息,点云数据通常包含数万甚至数千万个点,且每个点可以附加多种类别的属性信息。由此产生的海量点云数据给存储和传输都带来了巨大的压力和挑战,成为限制点云相关应用发展的一大瓶颈。因此,针对点云数据的压缩算法研究具有重大意义。本文针对现有两种主流点
学位