基于深度卷积神经网络的高光谱图像分类方法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:lengningyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着航空航天和成像光谱技术的发展,海量的遥感图像数据得以获取。其中,高光谱遥感是遥感应用中的一项核心研究内容。由于成像技术和光谱技术的结合,高光谱遥感能够捕捉到目标地物的几何空间特征和光谱维度信息,使得图像呈现出多维度,多角度的新特性。高光谱图像数据分类广泛应用于植被调查,生态环境检测,地质勘测以及城市调查等领域。高光谱图像拥有丰富的光谱和空间特征信息,传统的手动特征提取方式低效,繁琐,无法满足实际需求。随着深度学习技术的发展,高光谱图像分类的研究逐渐引入了智能化学习理论。尤其是神经网络的使用,使得高光谱图像分类性能得到了显著提升。虽然神经网络可以提取到更多抽象特征,但也存在以下两个难以解决的问题:(1)高光谱图像具有上百个光谱波段,且光谱信息连续,处理时需要消耗大量计算资源;(2)在实际的分类中,高光谱图像的训练样本极其有限,在小样本下学习到的特征信息极不可靠,导致分类模型的泛化能力有限,无法满足实际的应用。针对上述问题,本文从高光谱数据自身的特点出发,利用卷积神经网络自动提取光谱和空间特征,从而搭建一种端到端的模型。相比于现有分类模型,本文所搭建的模型在分类速度,精度,以及泛化性能上均有较大提升。具体研究工作及成果如下:(1)提出了一种基于残差连接的深度可分离卷积分类模型。深层的分类网络导致训练参数额外增加,训练时间较长,计算开销大。同时,较深层的网络易引发梯度消失问题。为此,引入了金字塔残差单元结合深度可分离卷积,构建了一个具有少量训练参数的残差单元。通过堆叠改进后的残差单元,构建了一个轻量级的高光谱分类模型。模型首层,采用1×1卷积层对输入高光谱的维度进行重新组合,实现跨通道信息融合,压缩了光谱维度。然后,利用中间层的残差单元提取空间和光谱特征。模型末端,使用1×1卷积和全局平均池层的组合替换传统的全连接层完成分类。随着网络的加深,每个残差单元的输出特征图呈小幅度的线性增加,能够连续地捕捉光谱和空间信息。实验结果表明,该模型的训练参数少,复杂度低,具有更高的分类效率。(2)提出了一种双路径小卷积高光谱分类模型。为解决现有神经网络的高光谱分类模型特征提取有限,泛化性能低下,设计了一个双路径小卷积模块。该模块融合了密集和残差两种特征学习路径,模块内全部使用1×1小卷积层捕捉特征信息。1×1卷积得到的特征图具有较好的泛化性能,残差路径可以复用特征信息,而密集路径可以不断地探索新特征。该模块利用两条路径连接的输出重新组合特征,用于下一层的输入,从而提取出更具判别力的特征。利用双路径小卷积模块依次提取高光谱数据的空间和光谱信息,从而构建了一个双路径小卷积分类网络。该网络模型摒弃三维卷积,全部使用二维卷积,有效提高了分类效率。相比现有其他分类模型,所提出的网络分类精度高,复杂度低,具有良好的泛化性能,即使在小样本和空间不相交样本上,依旧表现出更高的分类精度。
其他文献
在市场经济蓬勃发展的背景下,预约合同具有争取交易机会,降低合同风险等多种功能,在当前的市场交易中适用广泛,是促进商品贸易发展的重要工具。它具有较强的诺成性,包含了双方当事人将来订立本约之合意;内容较为明确、具有相对确定性,这使得其与意向书、备忘录等不具有相应法律约束力的文件相区分;应与本约合同有所区别,是约定将来订立合同的合同,因而还具备暂时性、阶段性的合同属性。研究预约合同的违约责任,必须事先确
学位
随着人工智能技术的发展,音乐播放产品呈现出智能化的发展趋势,而市面上音乐播放产品质量参差不齐,体验感较差。当下正是体验经济时代,用户更加注重产品的情感体验和使用感受,对产品的功能性、美观性、情感性等方面都提出了更高要求。多模态交互的音乐播放产品能提升产品的体验感和价值感,通过场景化应用、智能化交互、音乐视觉化等多重维度提高人们的生活品质。本文采用文献研究和实际调研的方式,同时结合跨学科知识对音乐播
学位
采用地球化学测试分析方法对鄂西地区上二叠统大隆组碎屑岩进行了风化程度、物源和构造背景研究,结果表明:鄂西地区大隆组沉积岩富SiO2、Al2O3和Fe2O3,贫CaO,平均质量分数分别为72.18%、9.77%、2.96%与0.08%;矫正烧失量后, Fe2O3T+MgO(均值4.25%)、TiO2(均值0.44%)、Al2O3/SiO2(物质的量比值,均值0.16),最接近活动大陆边缘特征值.球粒
期刊
多模态神经机器翻译任务旨在理解输入端的语义,以端到端方式融合图像和文本两种模态信息,以此实现源语言到目标语言的翻译。传统多模态机器翻译,在将源语言翻译成目标语言时,借助图像中的重要特征信息优化翻译过程。通过观察发现,虽然图像中包含丰富信息,但是当图像特征与源语言描述不匹配时,对翻译会带来干扰和噪音。且之前多模态机器翻译系统的翻译结果尽管有着较好的可读性,但在表达力上,有着明显的欠缺,主要的不足为:
学位
背景与目的:肺癌是全球癌症相关发病率和死亡率的重要组成成分之一。与2009-2010年的诊断相比,2015-2016年非小细胞肺癌(non-small cell lung cancer,NSCLC)患者的2年生存率增加了8%,每一个诊断阶段的绝对生存率增加了5%-6%。研究发现,与其他类型的癌症患者相比,肺癌患者的心理痛苦明显更大。而心理痛苦是一种不愉快的情绪体验,它受多种因素的影响,包括心理因素
学位
随着去产能、去库存、去杠杆、降成本及补短板等供给侧结构性改革重点工作的推进,国内家电企业面临着优化产品结构、提升产品质量等更高要求。不规范的资本市场以及日益严格的银行信贷条件,使得融资贵融资难问题成为了限制企业发展的关键问题。为了解决企业发展中面临的资金短缺问题,缓解传统融资模式对企业发展的限制,部分家电企业利用其在行业中的竞争地位优势,超常规占用供应链上下游企业资金,以此实现自身规模扩张和实力增
学位
视觉问答是计算机视觉与自然语言处理交叉研究的热点任务之一,可以应用于机器人、无人驾驶等多个领域。针对现有大多视觉问答模型仅能稳定回答简单问题的情况,论文从图像与文本的多模态特征交互出发,展开对回答复杂问题的研究,并在VQA2.0数据集上进行方法验证。主要研究工作如下:(1)构建具有关系计算模块的视觉问答模型,解决因关系信息缺乏难以回答目标数量统计类的复杂问题。该模型基于自注意力结构计算特征关系权重
学位
《义务教育语文课程标准(2022年版)》提出要发展学生的辩证思维。辩证思维是一种宏观看待世界的方法论,也是一种微观思考问题的方式,具有整体性与辩证性的特点。当前语文教学中的思维训练,更关注从“材料到观点”的逻辑思维发展,对辩证思维的训练不足。本文引进“正—反—合”的辩证思维方法,把它运用到文本分析、教学活动设计以及言语表达构思中,力图为语文教学中学生辩证思维的发展提供具体路径。
期刊
2017年党的十九大对实现第二个百年奋斗目标做出分两步推进的战略安排,明确提出到2035年实现法治国家、法治政府、法治社会的一体化建设,这一远景目标给我国法治建设提出了新要求。在实现基本建成法治政府的目标后,2021年8月我国制定并发布了《法治政府建设实施纲要(2021—2025年)》。纲要表明,到2025年,政府行为全面纳入法治轨道,为2035年基本建成法治国家、法治政府、法治社会奠定坚实基础。
学位
随着新冠病毒来袭,医院一线护理人员工作压力大、风险高、任务重,导致大量医护人员辞职,人才市场短时间内无法满足医院的人才需求,因此,国家通过提升护理人员的待遇来留住人才,出台了相关的政策文件。温州市也制定了相应的地方政策,来提升护理人员总体薪酬。W医院作为温州市公立医院典型代表,也在进行薪酬改革,虽然在改革中取得了一定成绩,但也存在一些问题。本文从这样的时代背景出发,从多个角度分析了W医院护理部人员
学位