基于长短期记忆网络的遥感图像压缩方法与硬件加速研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:chenxinguohn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感图像广泛应用于农业、工业、军事和商用等多个领域,随着信息科学技术的发展,不断增长的遥感图像数据量和有限存储空间、传输带宽之间的矛盾愈加突出,图像压缩技术是解决这一问题的有效手段。遥感图像局部纹理复杂、相关性低,遥感图像压缩的难度也随之增大。本文针对嵌入式平台下遥感图像压缩面临的高压缩比、高保真、资源受限和强实时等问题进行研究,提出了一种模型优化的遥感图像有损压缩网络,并进行硬件加速设计。在遥感图像压缩算法层面,本文分析了遥感图像特性和遥感图像压缩任务的需求,以具备残差迭代编码能力的长短期记忆网络(Long Short-Term Memory,LSTM)图像有损压缩算法为基础进行研究,从算法原理和应用场景角度分析了原算法在遥感图像压缩任务中的局限性,提出分块可控保真度有损压缩方法(Patch-wise Fidelity Controllable Lossy Compression,PFCLC)。实验结果表明,该算法在高压缩比下较传统算法具备更加优秀的视觉质量,并具备防误码扩散和可控保真度能力。在面向硬件实现优化层面,本文分析了嵌入式平台下PFCLC网络模型优化的必要性和可行性,并选用紧凑网络设计和模型量化技术对PFCLC网络进行优化。在紧凑网络设计中,基于深度可分离卷积提出了轻量化的PFCLC网络结构;在模型量化设计中,构建了卷积量化的LSTM模型,并提出了权重-特征图正负联合量化方法,减少量化损失,最终本文整合两种优化方法,提出了一个卷积量化的轻量化PFCLC网络。实验结果表明,优化后的网络和原网络相比在视觉质量几乎没有下降的前提下,计算量下降了95.29%,数据量下降了92.56%。在算法硬件加速层面,本文根据算法处理流程提出了一种基于SOC FPGA的PFCLC网络加速架构,该架构由计算推理核心、数据存储核心和网络控制核心组成。并针对给定资源下的网络架构并行度选择问题,提出了一种面向LSTM计算模型硬件资源感知的网络并行架构搜索算法。为验证该架构的有效性,本文基于Xilinx ZU9EG平台进行了PFCLC网络部署。经验证,该编码器在保证压缩性能的前提下,对于分辨率为128*128的分块图像,帧频可达120fps,功耗仅6.4W,具备应用于嵌入式平台下遥感图像压缩任务的能力。
其他文献
简单液体理论是20世纪后半叶凝聚态物理学所取得的最重要成就之一。在这一理论中,硬球模型和范德瓦耳斯模型抓住了原子或分子间排斥作用在决定液体结构中所发挥的核心作用;相反,吸引作用的效应可以简单地用一个平均场近似来处理,即吸引作用被认为只是提供一个空间均一的背景相互作用以维持液体的稳定,其对液体结构和动力学的影响甚微。然而,越来越多的证据表明,液体中存在一系列复杂现象,吸引作用在这些现象中扮演着重要角
由于维数灾难,高维空间的最近邻查询效率十分低下。而作为一种众所周知的解决方案,局部敏感哈希能够以常数的概率在亚线性时间内回答近似最近邻查询问题。但是,现有的粗粒度索引结构无法准确地估计候选点和查询点的距离,这会使得算法检测了大量不必要的候选点,继而降低了查询过程的性能。相比之下,本文提出了一种快速准确的基于内存的局部敏感哈希框架,称为中枢测度局部敏感哈希方案(Pivot Metric Locali
化学链燃烧是一种具有CO2内分离特性的新型燃烧方法,是解决化石燃料碳减排问题最有前途的技术之一。就我国“富煤、贫油、少气”的能源结构来说,发展煤的化学链燃烧技术是当务之急。作为一种实现固体燃料化学链燃烧的方式,化学链氧解耦燃烧(Chemical Looping with Oxygen Uncoupling,CLOU)因能够促使固体燃料转化速率与氧载体转化速率更相匹配而具有更加现实的应用前景。在煤的
研究背景2型糖尿病非酒精性脂肪性肝(Nonalcoholic fatty liver disease,NAFLD)的主要特征为糖脂代谢紊乱。而盐诱导激酶1(Salt-inducible kinase 1,SIK1)对于糖脂代谢有重要的调控作用,SIK1可磷酸化环磷酸腺苷转录调节共激活因子2(c AMP Regulated Transcriptional Coactivator 2,CRTC2)与固
半导体激光器和光放大器在光通信、光互联中有着极其广泛的应用。受限于非对称、小尺寸的有源区,其远场光斑不对称且发散角通常较大,因此与光纤的耦合效率较低,从而导致功耗和封装成本增加。本文提出了一种小发散角的半导体光放大器(Semiconductor Optical Amplifier,SOA)和一种小发散角的法布里-玻罗(Fabry-Pérot,FP)激光器,并分别对它们进行了优化设计和实验研究。本文
概率图模型是人工智能领域重要的统计机器学习模型之一,在个人信用风险评估、自然语言处理、生物医学等领域有广泛应用,非参数贝叶斯模型是其中特殊的一类,具有非参数模型和贝叶斯模型的双重特征。但其模型复杂度高,研究难度较大,尤其表现在非参数模型的模型结构、模型大小和分布函数可随观测数据的变化而变化,参数数量可随样本量增加而增长,导致机器学习时,分布函数难以确定,分布采样难度增加等问题。根据非参数贝叶斯模型
云计算应用的执行效率及资源利用率的优化是一个重要的研究领域。应用的配置信息是影响整个云操作系统效率的关键因素。Spark是一个应用广泛的云计算框架。COStream作为一门源到源的数据流编译语言,可以充分挖掘目标程序中的并行性。鉴于COStrean和Spark均采用DAG图记录数据的流向和操作,通过COStream对Spark程序内部的并行性进行预分析即可生成最佳的配置信息。为了生成最佳的配置信息
立体匹配是计算机视觉领域的重点研究方向,它的核心思想是获取同一物体在不同视角下的两幅图像的深度信息,所得的深度信息被广泛应用于三维重建、机器人导航和视频监控等众多任务。由于采用立体匹配获取深度信息具有高可靠性和低成本的优势,因此,通常将它作为获取深度信息的重要方式。然而,为获得更高匹配精度和计算效率,立体匹配算法仍需面临诸多不利因素如光照变化、曝光过度或曝光不足、深度不连续、弱纹理区域以及遮挡的影
太赫兹调制器是太赫兹通信系统的核心组成部分,随着太赫兹通信技术的飞速发展,小型化集成化太赫兹调制器的发展越来越受到关注。作为多铁材料的代表,铁酸铋薄膜具有良好的光学和光电性能。超材料的出现改变了人类对自然界材料的认知,它对电磁波的响应可以通过改变几何参数来进行定制。本文采用激光泵浦的方式,利用太赫兹时域光谱技术研究了基于铁酸铋薄膜和超材料的太赫兹波调制器件,并进一步探讨了在外部光场作用下铁酸铋薄膜
企业运营管理的主要目标是降低成本并提高效率,这也是企业增强竞争力的源泉。因此,运营管理在企业管理中具有非常重要的地位与作用。降低运营成本的常用方法是优化企业库存策略。然而,在实际运营决策过程中,企业往往会产生与决策量无关的成本(如运输成本中的路桥费用等),即固定成本。虽然学术界已经对库存策略进行了大量研究,但现有的大部分研究都忽略了固定成本。而且,不同企业的成本结构、需求类型及顾客退货情况是不同的