基于深度学习的遥感图像分类算法的快速硬件实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:HUANming520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为对地观测技术的重要组成部分,遥感图像分类已被广泛应用于国防和民生经济等领域。传统的图像分类算法难以准确描述高分辨遥感图像丰富的空间细节和语义信息,分类精度不高,难以满足下游任务中信息分析和情报提取的需求。近年来,以卷积神经网络为代表的深度学习技术,凭借其优秀的表征学习能力,为遥感图像分类任务带来了性能上的巨大提升;但在资源受限的终端,卷积神经网络的庞大参数和计算量为模型高效实时部署带来了巨大挑战。针对上述问题,本文从算法软硬件协同与灵活部署实现的角度出发,提出一种基于秩映射的轻量化遥感图像分类算法,设计实现了面向遥感图像精准分类的端到端的轻量化神经网络加速器。本文的主要成果如下:一、针对深度神经网络存在大量参数和计算量的问题,本文提出了一种基于秩映射的轻量化方法,有效降低了网络复杂性。由于残差块可以高效学习特征并抑制网络“退化”,本文以残差网络(Res Net)作为骨干网络,完成基于秩映射的网络轻量化算法。通过特征图的平均秩映射,本算法衡量了权重滤波器的重要性,剪去了低秩特征映射对应的滤波器来轻量化网络,在网络分类精度损失可控的情况下实现更高压缩比的网络轻量化。实验结果表明,Res Net网络在UCM和NWPU遥感数据集上拥有高精度的分类性能;剪枝后的网络拥有不弱于原始网络的性能表现,参数量下降86.8%的情况下仅损失0.98%的平均分类精度。二、针对底层硬件加速电路灵活性较差和设计开发困难等问题,本文设计实现一种高度参数化的底层加速电路框架,以针对不同资源的FPGA设备完成灵活部署和迁移。本文使用高层次综合(High Level Synthesis,HLS)完成高速并行和流水化的指令获取、计算单元、数据加载和存储模块的电路设计。通过设置内部模块的位宽和深度来便捷调整底层硬件的资源占用,实现高度参数化和模块化的加速器,优化内部迭代流水和指令集调度。此外,本文以通用矩阵乘法(GEMM)单元为核心完成高密度矩阵乘法加速,向编译器堆栈开放通用张量计算接口,完成了一种基于FPGA的高吞吐量的流水化深度学习加速硬件实现电路。三、针对缺乏将网络框架映射到底层硬件原语的编译器的问题,本文借助TVM编译器,完成端到端神经网络编译。本文基于TVM堆栈编译器完成了模型导入和计算图自动编译优化,调用参数化的底层加速电路,完成自动调优和8bit量化的轻量化部署,充分调用FPGA和ARM CPU资源,软硬件协同完成算法加速,最终在PYNQ-Z2 FPGA平台实现一个端到端、从网络框架编译到底层硬件原语的智能调度遥感图像高精度分类实时处理系统。实验表明,在网络性能损失可控的情况下,基于FPGA的神经网络加速器相比ARM CPU最高可实现11倍的时间加速。
其他文献
目前学界为数不多的将经典叙事学运用于翻译批评的研究,多聚焦于叙事视角、话语呈现方式、讲述与展示、叙事时间、不可靠叙述、叙事距离6个元素,而且留有很多深入研究的空间。这在理论和实践上都难以满足译本全面的叙事翻译批评需求。本文又提出叙事空间、隐含作者、元叙事、易读性与可读性、叙事结构、叙事功能6个元素。通过运用跨学科移植法和“规定+描写辩证批评法”,我们建立一个包括上述12个元素以及相应详细考察要点的
期刊
报纸
5G通信产业本身对于频率源的准确度和稳定度的要求很高,使用中国北斗卫星导航系统(Bei Dou Navigation Satellite System,BDS)信号驯服恒温晶体振荡器(Oven Controlled Crystal Oscillator,OCXO)改善恒温晶振输出频率的老化漂移和稳定漂移的技术是解决部署问题的关键。如何提升恒温晶振在失去锁定后的保持能力成为至关重要的问题。本文研究提
学位
随着电子数据采集设备的普及,每天都有大量的信号序列数据通过网络传输的方式,源源不断的输送到数据终端。这些采集到的序列数据里,相邻事件之间可能存在某些必然的联系,揭示设备中事件的发生规律。近年来,计算设备数据处理能力的提升,使得人们从海量序列数据中,挖掘出频繁出现的序列情节片段成为可能。如何对序列信号数据进行高效的频繁情节挖掘,发现序列信号中潜在的规律信息,引起学术界的持续关注。与序列模式挖掘不同,
学位
深度卷积神经网络模型已经成为图像分类应用的基石,在生物认证、智慧医疗、自动驾驶等场景中发挥重要作用。近年来,对抗样本揭示了卷积分类模型的脆弱性,向模型的安全性提出了严峻挑战。攻击者通过在原图像素上添加扰动生成对抗样本,令模型错误地判断图像类别,但对于人类视觉系统而言,对抗样本和原图的类别一致。然而,由于神经网络工作机理的高复杂性和不透明性,至今无法提出一步到位的方法使模型产生免疫。因此,以增强模型
学位
在行人检测领域,基于卷积神经网络的深度学习技术已经取得了比传统方法更好的检测性能。但随着深度卷积神经网络的迅速发展,检测模型的网络结构也愈加复杂,参数量和计算量快速增加。在计算资源有限的硬件设备部署行人检测模型时,如何在保证检测精度的条件下满足检测实时性的要求就成为亟需解决的问题。本文围绕基于锚框的单阶段行人检测方法展开研究,针对在计算资源有限的硬件设备实现行人检测任务所面临的实际问题,结合轻量化
学位
在深化安全建设、完善社会治安立体化防控体系的要求下,监控系统作为一种网格化管理的有效安防方案,正朝着全方位、超高清的方向发展。而随着监控相机布控数量不断增加,传统的多屏切换播放方法逐渐暴露出内容离散、相关性弱等缺点。这为用户添加了对时空信息的认知负担,并且无法满足智能监控多维度、立体式的可视化需求。本文针对如何实现多路监控视频的有效整合与直观可视化这一亟待解决的问题展开了研究,结合增强虚拟现实技术
学位
随着科技的飞速发展,光谱成像技术日益精进,针对于高光谱图像的解译处理已成为遥感领域的研究热点之一。相较于其他传统成像方式,高光谱图像具有信息量大、光谱波段范围广、谱段分辨率高等特性。因此,其现已被广泛应用在地质监测、农业生产、环境评估以及军事侦察等多个领域。对于高光谱图像而言,可看作是由相同场景组成的三维立方体,其中每个维度的成像场景都与特定光谱波长相关。大量的光谱信息简化了地物类别之间的判别差异
学位
人像摄影是一种热门的拍摄题材,然而在很多场景下,诸多不可控因素,如背景人物众多、背景繁杂等,都会导致成片效果不尽如人意。此外,静态的图像不能像视频或动图一样表达丰富的信息,如果能使目标人物在同一张照片中反复出现,就可以通过让目标人物摆出不同的姿势来表达丰富的信息。现有的方法大多通过Photo Shop等图像后期处理软件,人为判定背景人物并进行图像复制粘贴等处理达到上述特效效果。这种方法不仅操作费时
学位
监控视频中异常事件检测旨在识别真实监控视频中出现的各种异常事件,并及时做出相应的处理,进而更好地维护社会公共安全。近年来,基于深度学习的监控视频中异常事件检测算法在提升模型检测性能上取得了较好的进展,但仍然存在监控视频中的时空冗余信息影响异常事件检测精度、正常事件和异常事件判别界限不清晰等问题。因此,监控视频中异常事件检测仍然是一项具有挑战性的课题。鉴于此,本文提出了基于记忆引导注意力的无监督异常
学位