基于轻量级深度注意力网络的遥感影像场景分类方法研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:aivinator
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着遥感卫星技术的发展,遥感影像空间分辨率可达亚米级。与中低空间分辨率卫星影像相比,高空间分辨率卫星影像具有更丰富的空间细节信息,能够精细呈现出地物的颜色、形状、边缘等。基于像素级或目标级的遥感影像解译方法不能有效提取遥感影像的高层语义信息,场景分类方法能够建模并解译以语义目标构成下复杂空间分布的高层语义信息,可解决遥感影像解译中的“语义鸿沟”问题。目前场景分类方法主要是基于深度学习技术,通过数据驱动可有效解决光谱特征自动提取、多源传感器影像差异等问题。然而现有的基于深度学习的算法运算量大,模型参数量多,无法直接部署在资源受限的设备或实现在线遥感解译任务。此外,由于遥感场景影像存在“类内方差大,类间方差小”的问题,深度网络特征提取能力受限。针对上述问题,本文主要从模型轻量化,空谱特征提取方面进行研究,主要贡献如下:(1)归纳和总结遥感影像场景分类领域的国内外研究现状,并分析了高空间分辨率遥感影像特点和遥感影像场景分类存在问题。此外,介绍了基于深度学习的场景分类基本理论,场景分类数据集和评价指标。(2)针对卷积神经网络轻量化与空谱特征提取问题,本文提出一种基于轻量级注意力的场景分类方法。该方法首先利用Ghost卷积替换标准卷积以减少模型的参数量并降低网络特征冗余,然后利用协调注意力关注遥感影像的通道和空间特征,并提出一种测试时数据增强策略,在不增加模型参数量和推理速度的前提下进一步提高算法准确度。(3)针对卷积神经网络以堆叠感受野的方式提取特征、建模不直接的问题,本文提出一种保留空间通道信息的 Spatial-Channel Feature Preserving Vision Transformer(SCViT)场景分类方法。该方法首先利用Vision Transformer(ViT)模型可以通过多头自注意力机制直接考虑远距离信息交互,然后引入渐进式聚合策略在嵌入的过程中考虑遥感影像局部的空间信息,再使用轻量级通道注意力模块考虑关注遥感影像的通道信息,由于提高了空间和通道的特征提取能力,因此仅需较少的层数可达较好的分类精度。(4)本文设计并实现了基于轻量级深度网络的场景分类原型系统,并在UCM、AID和NWPU三套数据集上对比了本文提出的两种场景分类方法。同时,以Google Earth遥感影像实现了银川市的城市功能区遥感监测,该成果能够快速准确的在场景数据集和银川市遥感影像上执行场景分类任务,可有效助力“建设黄河流域生态保护和高质量发展先行区”。
其他文献
医学影像分割是医学影像分析的核心任务,随着计算机技术及人工智能的发展与普及,医学影像分割潜在的应用价值受到了广泛的关注,脊柱分割作为医学影像分割中一个重要的方向,在临床实践中,退行性脊柱疾病方面的治疗更多的还是依赖于医生的经验,虽然现有的脊柱分割方法在无偏且数据集数量较大的条件下表现良好,但是在真实条件下,由于影像数据收集难度较大及收集过程中病人个体因素,导致不同脊柱类别样本数量不均衡,进而限制了
学位
西夏文古籍文献作为记载西夏王朝的资料,已成为研究少数民族古籍的重要载体,及时准确的识别并翻译西夏文字,有助于推进西夏学研究具有举足轻重的意义。此外,随着深度学习的蓬勃发展,神经网络具有自动提取文字特征并且识别效率高等优势,逐渐成为了文本识别的重要手段。然而,现有的西夏文古籍文献中存在字体相似度高,识别准确率较低,同时识别模型参数量大的问题。因此,针对上述问题,本文以自制的西夏文数据集为基础,采用深
学位
人脸识别技术的快速发展以及广泛应用给我们带来了极大的便利,但易受假脸攻击的缺点使其安全性受到了严重的威胁。人脸活体检测作为人脸识别的重要前置步骤,保证人脸识别系统不被欺骗,具有重要的研究价值。近年来,基于深度学习的人脸活体检测技术在生物识别技术领域取得了一定的发展,在部分场景下表现出色,但受限于常规卷积网络对人脸固有精细特征提取的瓶颈以及单模态人脸图像输入对环境变化和攻击方式变化敏感,现存方法难以
学位
在我国,道路交通事故时有发生,其中一个重要原因就是疲劳驾驶。所以,准确地进行疲劳检测是非常有必要的。在现有的疲劳检测方法中,利用基于生理参数和车辆运动特征进行的检测普遍存在成本高、实时性差和抗干扰能力低等问题。因此,本文采用一种基于面部特征的方法研究疲劳检测问题,该方法将疲劳检测流程分为人脸检测、疲劳特征提取与识别、疲劳状态判别三个步骤,具体工作如下:首先,优化了MTCNN人脸检测算法。对图像预处
学位
随着深度学习技术的快速发展,大量基于深度学习的单视图三维重建方法不断涌现,这些方法在3D打印、自动驾驶、虚拟现实和增强现实等各个领域获得了广泛的应用,实现高质量重建的单视图三维物体重建算法对于图像理解和计算机视觉领域来说有其重要的研究价值和广阔的发展前景。已有的大部分方法难以有效地重建具有复杂拓扑结构的物体形状,导致重建的结果拓扑结构不完整和局部细节缺失。此外,这些方法较多的关注目标物体的整体形状
学位
3D人脸重建和稠密对齐任务是计算机视觉领域的一个重要分支,通过对人脸的五官信息和轮廓细节信息的分析,神经网络可以学习其内在丰富的上下文语义信息,从而做出精确的预测。基于单张图像的3D人脸重建与稠密对齐是计算机视觉领域的一项挑战性任务,当前大部分3D人脸重建与稠密对齐任务在学习过程中缺乏从几何角度考虑人脸结构特征的相关性,使得神经网络在大姿态、强光照以及遮挡等复杂条件下很难恢复出精细的人脸重建结果与
学位
近年来,深度学习技术在很多领域取得了突出成就。其中,图像分类作为其他视觉任务的基础,更是在各行各业中取得了广泛的应用。深度学习技术通常需要依靠大量的标注数据,但是在很多状况下受各方面的制约,标注数据很少。为了适应这种情况,小样本学习应运而生,成为深度学习技术的一大分支。由于标注数据少,在小样本学习过程中通常会发生过拟合的问题,而将先验规则加入深度学习模型,能够增强模型的泛化能力,提高分类精度。此外
学位
随着科学技术的飞速发展,学者们所研究的被控系统的结构越来越复杂、规模越来越庞大,传统的确定性系统的控制理论已趋于完善.近年来,含有噪声或不确定性的随机模型是当前控制领域的研究热点之一.噪声的存在改变原系统的动力学特征,降低了系统的控制性能,甚至破坏系统的稳定性.因此随机系统的稳定性研究具有重要的理论意义和实际需要.此外,时滞、外部干扰、不确定性在实际系统中广泛存在,这些元素的存在往往会影响系统的稳
学位
随着医学成像技术和计算机技术的不断发展,计算机辅助诊断逐渐成为临床上辅助医生的主要工具。近年来,全球脑肿瘤病人持续增加,产生大量MRI图像,使得影像科医生不得不高负荷工作。因此,迫切需要精准的脑肿瘤图像自动分割技术辅助医生工作。基于深度学习的方法已经快速发展为医学图像分割领域的研究热点,它可以在医疗图像大数据分析中自动学习隐含的疾病特性信息。脑肿瘤图像具有语义简单、三维结构等特点。而深度学习中的V
学位
知识图谱是现代人工智能的核心基础设施,随着人工智能的迅速发展,各种知识图谱被构建出来。与此同时,由于存在着难以去除的噪声与错误等不确定因素,使得知识表达难以完备化,知识图谱中出现了不确定信息。传统的知识图谱表示学习方法不能满足不确定知识图谱的表示及应用需求。因此,带有不确定信息的知识表示学习成为一项紧迫又富有挑战的任务。论文从不确定性知识图谱表示学习模型入手,通过对不确定知识图谱表示学习模型中的得
学位