基于深度学习和空谱联合先验的高光谱遥感解混研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tielian77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过成像仪获取的高光谱遥感图像具有光谱分辨率高、波段频率密集的优点,其所包含的丰富光谱和空间信息使得高光谱遥感图像在包括军事和农业等各个领域都有着广阔的应用范围和前景。然而,由于成像设备的限制,高光谱遥感图像的光谱分辨率在提高的同时,还存在空间分辨率降低的问题。空间分辨率的下降使得采样得到的图像数据中存在大量混合像元,每个像元对应的真实地物空间中包含多种物质,而成像设备获取的像元光谱曲线是由多种不同地物的光谱按照一定比例混合形成。混合像元的存在严重制约了高光谱影像的后续处理精度及其广泛应用。因此,研究高光谱影像混合像元分解(解混)技术具有非常重要的现实意义。基于深度学习的解混方法由于具有较强的拟合能力成为近些年解混领域的热点,但目前主流的深度学习解混算法大部分只考虑了高光谱图像的光谱信息,而没有加入图像的空间结构信息,使其解混精度受到了限制。经典解混算法中基于空谱联合先验引入空间信息改进了解混精度,因此如何在深度学习解混模型中引入空谱联合先验是本文主要的研究方向。本文的主要工作如下:(1)提出了基于循环神经网络和链式分类器的有监督解混算法。首先提出了基于长短时序记忆网络和链式分类器的解混方法,根据单个像元光谱曲线的序列化性质,使用序列化模型长短时序记忆网络进行特征提取。同时引入链式分类器替代传统的softmax分类器,更符合解混的多标签分类性质。在此基础上,加入一维卷积网络,与长短时序记忆网络分别提取局部特征和全局特征,提出基于融合网络和链式分类器的解混算法。该方法在多个真实数据集上取得目前最优的结果,证明了方法有效性。(2)提出了基于流形正则的多视角协同解混算法。算法首先对标记样本集进行多视角划分获取独立完备的特征子集,使用循环神经网络进行分段特征提取,去除子集内部冗余信息,捕捉子集间互补信息。同时使用滑动窗口采样取代单个像元输入到网络中,并加入流形正则基于空间信息对解混结果进行约束,以提升解混精度。该方法充分利用高光谱数据的空间信息和光谱信息,在多个数据集上取得较高解混精度。(3)提出了基于全局空间信息的动态图卷积解混算法。首先综合考虑像元光谱维度的相似度以及空间维度的位置关系进行图结构构建;之后通过引入动态构图的动态图卷积神经网络提取子图中的空间结构信息,充分利用标记样本,挖掘特征空间边缘的几何分布,获取高质量像元特征向量。最后基于高质量的特征向量和空间正则约束项得到解混结果。该算法在多个数据集上使得解混精度得到提升。
其他文献
基于深度学习的医学图像分割算法往往需要大量的标记样本用于网络训练。然而,医学图像的像素级标记成本较高、难度较大,且需要具备专业知识。这导致目标域中通常不存在手工标注的样本。并且,由于医学图像的异构性与复杂性,来自不同成像设备的数据之间存在分布差异,这种分布差异构成的域偏移会使得在源域上训练得到的分割模型应用于目标域时的性能发生退化。利用迁移学习的思想,将源域中的知识迁移到无标记的目标域上,是解决以
学位
伴随着人工智能技术的日渐成熟,“智慧城市”这一词汇逐渐被人们所关注。图像的语义分割作为计算机视觉领域中的重要任务之一,在建设“智慧城市”的进程中起到重要作用。比如,在自动驾驶领域中对传输图像进行语义分割帮助车辆进行路线的规划;对飞机着陆前拍摄的俯视图进行语义分割辅助飞行员安全着陆。近年来,基于卷积神经网络的方法在语义分割问题上取得了一系列突破,主流的语义分割网络通常基于编解码器结构。但在大部分语义
学位
随着电子信息技术等相关技术的发展,视频已经逐渐成为生活中不可或缺的信息媒介。当前各种数字环境中存在的海量视频数据具有着极大的价值,因此,利用计算机进行视频的内容理解、信息挖掘已经成为研究者的重要课题。近年来,深度学习在图像处理等领域取得了前所未有的成功,这也促使了基于视频的人体行为识别技术的发展。目前行为识别领域还存在着诸多挑战,比如人体行为在类内和类间均有较大的变化,不同视角、不同速度下的同一类
学位
近年来,随着计算资源以及数据规模的大幅增长,深度学习取得了前所未有的成功。在多个领域和多种任务上,如图像识别、语义分割、文本分类、语音识别、多模态学习等,深度学习都发挥了举足轻重的作用。然而最近的一些研究发现,对抗样本广泛存在于各种深度学习领域,给深度学习系统的现实应用带来了巨大的威胁,尤其是一些安全性敏感的深度学习系统,如自动驾驶、行人重识别、智慧医疗等。对抗样本是一些在自然图像上添加人为构建的
学位
近年来,以深度卷积神经网络(Deep Convolutional Neural Network,DCNN)为代表的人工智能技术迅速发展,在图像识别等特定领域的性能已经接近甚至超过以人类为代表的灵长类动物。然而,在目标/背景复杂多变、遮挡和干扰等复杂开放场景下,DCNN模型的性能容易急剧下降,而灵长类动物仍能快速、准确、稳定地识别目标,这表明现有的DCNN模型在数据驱动的模式下,还很难像灵长类动物大
学位
视频时空定位任务是计算机视觉和自然语言处理技术两个领域的交叉融合,可被广泛地应用于安防监控、视频检索等领域。关系时空定位和多句式查询文本的目标时空定位是视频时空定位任务中的两个新兴的研究分支。现阶段的关系时空定位方法利用目标空间特征构建目标之间的动态关系特征,通过信息的单向传递定位符合关系的多目标时空轨迹,然而其忽略了信息的双向传递对定位的指导作用,且错误的信息在单向传递过程中难以被矫正。同时,现
学位
近年来,随着深度学习技术的迅速发展,基于有监督学习的方法在各种视觉任务上达到了很好的性能。然而,这类方法依赖于大量有标签的训练样本,学习得到的分类器往往能够较好地识别训练过程中见过的样本类别,而无法很好地迁移到训练中未见过的其他样本类别。为了解决这种缺少有标签数据的学习任务,零样本学习(zero-shot learning)受到广泛关注,即一个神经网络模型将在已知类别的样本数据上学习到的知识迁移到
学位
现代军事战争大多发生在复杂地、海环境中,目标所处背景对于雷达探测与识别的影响不容忽视。通常将目标所处背景看作是单层介质粗糙面,只研究粗糙面与上方目标的电磁散射问题。但是实际中的自然环境组成复杂,如植被覆盖的土壤、雪层覆盖的土壤、溢油海面、浮冰海面等通常为多层介质。在研究时,除了粗糙面与上方自由空间的散射问题,对于上层和下层粗糙面之间发生的电磁波透射问题也要重视。对分层粗糙面与目标复合电磁散射进行研
学位
图像去噪作为一种计算机视觉、图像处理领域的基础性任务,在生产制造、医学健康和卫星遥感等领域具有重要的应用价值。图像去噪是一种逆问题,其目的是从噪声观测中估计出未被噪声污染的图像,实现图像质量的增强,继而使后续的图像处理、分析等环节免受噪声影响。在过去几十年,基于不同理论的图像去噪方法相继被提出。其中,传统方法原理清楚、计算简单,然而去噪效果不够理想;基于神经网络,特别是深度神经网络的方法,近些年在
学位
有限元方法(Finite Element Method,FEM)作为一种计算精度较高的全波算法,常被用于具有复杂媒质、复杂几何结构的目标的电磁特性分析,但由于该方法基于体网格离散计算区域,网格量随目标的电尺寸的增加而剧烈增长,在进行诸如带罩天线阵列电磁辐射、复杂环境下电磁散射等电大尺寸目标的电磁特性分析时,常见的PC机甚至工作站往往无法满足其计算所需的庞大的计算资源,严重限制了有限元方法在实际工程
学位