基于半监督学习的铀矿床高光谱遥感数据降维的应用研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:carinalove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高光谱遥感是目前遥感技术的前沿,其纳米级的光谱分辨率能够提供更加丰富的地物信息。随着高光谱遥感的在各个领域的深入研究,其广泛的应用价值备受到国内外的关注。   高光谱遥感数据具有数据量大,波谱覆盖范围广,分辨率高和数据冗余等特点。直接对获取的高光谱数据进行分析处理的效果不佳,Hughes现象表明,大量的高维数据会降低高光谱数据分类的准确性,因此有必要对高光谱遥感数据降维,将高光谱的原始的高维特征空间转化为保持原始特征空间的全局和局部结构的低维特征空间,提取最能反映其类别信息的新的高光谱数据特征。   目前,高光谱降维研究主要集中在监督信息和无监督信息的领域,主要的处理方法有特征选择和特征提取。特征选择是在保留原有光谱信息的情况下尽量减小高光谱的波段数目,通过提取的波段子集来代替原始数据集合。其过程就是利用光谱曲线样本的监督信息或者无监督信息来构造筛选波段的评估准则,结合搜索效率高的搜索算法,找出接近于全局最优的波段组合,特征选择方法一直在遥感的降维研究有着重要地位。特征提取是通过对高光谱原始数据特征进行组合变换产生的新特征,这些新特征保持原始数据的信息,并且其维数要远远小于原始特征。   本论文结合高光谱样本数据特点,将半监督降维方法应用到铀矿床高光谱降维实验中。目前获取的高光谱样本数据中,大部分是未标记类别信息的样本,只有少量的带有类标记的样本。因此考虑半监督降维的思想,将大量未标记的样本与少数未标记样本有效结合,使其提取的新特征更能够提高分类性能。本论文首先介绍了高光谱数据的读取和预处理,然后从特性选择和特征提取的两个方面,结合监督信息和无监督信息的评价准则,构建了高光谱降维的一般模型,在地物高光谱数据和高光谱遥感数据上进行了实验。然后分别实现了基于无类标号信息PCA降维方法和基于带类标号FDA的降维方法。这两种方法主要从类内离散度和类间离散度来度量优化标准。分析FDA的思想,可将PCA转换为仅有一个类别的FDA,那么两者的代价函数可以用同种方式表达,对于带标号和不带标号的数据可以利用加权线性结合,也就是基于半监督思想的SELF算法。SELF算法有效的结合了两类数据的特征,能利用较少的带类标记的商光谱遥感数据样本引导数据的降维。在铀矿床高光谱遥感图像选取了部分样本作为实验数据,与监督和无监督的降维算法做实验对比,贝叶斯分类器做评价标准。基于半监督的SELF算法在拥有30%的带类标记的样本时,就能达到监督算法的分类精度,并且其降维的维度要小于无监督的降维方法。实验研究表明半监督方法在保证精度的情况下,能够充分利用标记的样本信息。如果应用于实际,将大大减少一些人工实地探测开销,节省成本。
其他文献
当前,无线网络发展的一个重要趋势是从单跳无线网络发展为Mesh和Ad Hoc等大规模多跳无线网络。相比于单跳无线网络,多跳无线网络的网络拓扑和无线链路间的数据传输冲突关系远
虚拟人动作合成是利用计算机技术模拟人运动的过程,在多媒体领域有着广泛重要的应用,如影视特效、动漫、视频游戏以及虚拟现实等。目前,虚拟人动作合成主要有三类方法:交互式
卫星移动通信网络作为卫星移动通信业务的基础支撑系统,综合利用了现代通信技术、计算机技术、航天技术和半导体集成电路技术,是当前通信领域发展非常迅速的方向之一。它具有许
随着经济和社会的发展,网络已经成为我们生活中必不可少的一部分,我们的生活、学习和工作中都有网络。互联网应经成为全世界最大的网络,而网络的连接是通过各种媒介完成的,从原始
随着对区域化探异常识别研究的深入,研究者提出了许多有效的区域化探异常识别方法。近些年来,随着该领域相关计算机技术的进一步深入研究,新的数据挖掘分类方法逐渐被引入到区域
可视化技术日趋成熟,已在虚拟现实和三维交互设计等许多重要应用中体现出来,特别是实时仿真的应用领域。虚拟现实是可视化技术应用的一个重要体现,在网络技术的发展推动下产
随着传感技术、互联网、通信技术的高速发展,物联网的概念被提出来并且逐渐深入到人类的日常生活中。物联网的使用遍及各行各业,特别是在物流管理中已经得到很成熟的使用。之外
半导体分选机是集成电路半导体元器件在基板封装后切割成单个芯片,并对其进行剥离及外观分选的自动化设备。目前,国内尚无生产半导体分选设备的厂家,而且从国外引进价格昂贵、维
片上多核处理器以其效能高、设计周期短等优势成为高性能处理器设计的主流架构。相变存储器以其集成度高、漏电功耗低等优势受到多核处理器系统结构设计和研究的广泛关注。另
并行应用对计算能力的需求永无止境,推动着超级计算机在不断提高单个计算单元性能的同时不断增大系统规模。系统规模的急剧增长,造成消息通信带来的开销日益增加。以全局归约