迁移学习在铀矿床高光谱遥感数据分类中的应用研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:playboy200000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高光谱遥感技术是20世纪80年代以来对地观测领域出现的一种新型的遥感技术,是目前遥感技术发展的前沿之一。高光谱遥感具有较高的光谱分辨率和连续的光谱覆盖特性,使得在传统的多光谱遥感领域中不可探不可测的物质在高光谱遥感中很容易被探测到,其提供的海量数据信息大大提高了数据分析的质量和可信度。目前,高光谱遥感技术已经广泛应用在地理学、地质学、生态学、农业科学等领域的研究和应用当中。   高光谱遥感的分类研究是遥感应用领域的热点之一。其主要是通过遥感数据所提供的信息对地物进行分类,即对地物目标的物理属性进行识别。遥感数据分类经过几十年的研究和发展已经形成了十分丰富的理论和方法,并在多光谱遥感领域取得了成功,然而,受限于多光谱遥感所提供的信息量,很难对地物间的微小差异进行精细识别。而高光谱遥感的出现提供了前所未有的大量信息,为地物理化特性的深层探索提供了可能。   与传统的遥感技术相比,高光谱遥感数据具有光谱分辨率较高、波谱宽度窄、数据信息量大等优势,但有碍于物理设备的局限、大气水汽吸收的影响、波段相关性强等特点,也造成了噪声增加、冗余增多的弊端,这些都对高光谱遥感的数据解译和有效利用造成了困难,也使得传统的多光谱遥感分析方法和常用的数理统计方法在高光谱的研究中不能完全适用。因而,如何更加有效且快速准确的利用高光谱遥感数据所提供的最大信息,研究适合于高光谱遥感数据分类的处理方法和技术,是高光谱遥感技术研究的主要热点和发展方向。   近年来,随着机器学习和数据挖掘技术的飞速发展,越来越多的智能研究方法被引入到高光谱遥感的研究当中。与传统的数理统计和专家方法不同,智能方法更加自动化,具有更强的可操作性,而且可以大大减少人力的投入和消耗。目前,人工神经网络、决策树、支持向量机等方法均已应用在高光谱遥感数据当中,并取得了不错的分类处理效果。“基于智能算法的高光谱数据处理软件”首次创新性的将演化算法与高光谱遥感技术相结合,形成了一套全新的高光谱遥感铀矿床识别技术。   随着机器学习和数据挖掘技术研究领域的不断深入,针对不同问题的新的研究方法不断涌现,迁移学习即是一门新兴的机器学习研究方法。相比于传统的机器学习方法,迁移学习并不要求训练数据集和测试数据集遵循一样的分布,这也更符合现实生活中的应用情况。依托互联网产业的高速发展,迁移学习已经广泛应用在文本分类、图像识别和Web数据挖掘当中。在铀矿床高光谱遥感分类的应用研究中,现有的分类先验知识并不充足,存在大量无类标记的数据,且由于成矿原因等不同,其训练数据集和测试数据集的概率分布也不尽相同,正好可以将迁移学习的方法引入其中,从而充分利用已有物质分类的先验知识,根据地理地表蚀变成因的不同,将原有的识别分类模型迁移到铀矿床的识别当中,以期取得较好的效果。进而,根据迁移学习的基本原理,利用合理的先验知识,适当的根据新的目标域数据调整模型,便可以将类似的、具有一定相关性的地物及矿物识别体系引入到其他类型的物质识别当中。本论文通过对铀矿床数据、人工数据、遥感数据和文本数据的实验表明,通过迁移学习,可以在现实应用的数据分类中取得较好的实验效果。   本论文依托于国家高技术研究发展计划(863计划)课题“基于演化数据挖掘的铀矿床高光谱遥感信息自动提取技术研究”,专注于对迁移学习算法的研究,并顺利的将其应用在高光谱遥感数据智能分类的研究当中。我国是铀矿资源不甚丰富的一个国家,作为一种重要的战略性资源,铀矿在我国国防和经济建设中都扮演着举足轻重的作用。因而,如何通过智能的方法合理利用高光谱遥感所提供的丰富信息,以低成本、高效率的方式发现铀矿储备是当前铀矿科研中亟待解决的重大课题。本论文在国家863计划课题的科技研究成果之上,创新性的提出将迁移学习的方法应用到铀矿床高光谱遥感数据的分析处理过程中,取得了较好的实验效果。本论文的具体研究工作主要包括以下几个方面:   1.描述了高光谱遥感数据的基本概念,讨论了遥感数据的获取和预处理问题。以甘肃芨岭地区的701和706铀矿床Hyperion高光谱数据作为来源,对Hyperion卫星数据中由于传感器、大气水汽、数据转换过程中所产生的错误和误差数据进行剔除和修复。介绍了高光谱遥感数据预处理的流程和原理,讲述了水汽去除,坏线修复、条纹去除、smile效应去除、大气校正和几何校正的基本原理和方法,最终得到了可以进一步操作和使用的反射率数据。   2.对迁移学习的基本原理和优势进行了介绍,对比了迁移学习和传统机器学习的异同,讲解了迁移学习适用的环境和条件,并对负迁移和现行的研究成果进行了简单的介绍。   3.介绍了TrAdaboost算法的基本思想和原理,提出了将wagging算法和TrAdaboost算法相结合的TrMultiBoost改进算法,为TrAdaBoost算法增加了抖动效应。并在实验研究中取得了一定效果。   4.在TrAdaBoost算法中加入重采样算法,提出了一种改进的TrResample算法,在每次迭代前,首先对源域样本进行加权重采样,通过重采样可以提取出会更加有利于目标域学习的样本,使其对目标域数据训练的贡献增加,在目标域数据样本不足的情况下可以为源域提供更多优质的辅助数据。在实验中,可以看出,加入重采样算法后可以有效的提高目标域的训练精度。   5.在铀矿床高光谱遥感数据上进行了实验研究,实验结果表明,将迁移学习应用到高光谱遥感数据分类中可以取得不错的实验效果。
其他文献
即时通信,指实时收发并处理互联网消息的业务。随着移动互联网的飞速发展,即时通信类应用已经成为人们日常生活中使用频率最高的应用,深刻地改变了人们的生活方式。目前移动
认证密钥交换协议旨在为用户分发安全的会话密钥,使用户能借助安全的会话密钥以及相应的密码算法进行安全通信。近年来,该类协议被广泛应用于保密通信、安全认证以及电子商务等
随着智能手机、数字娱乐等信息产业的快速发展,人脸检测成为了计算机视觉、增强现实以及图像识别领域的研究热点。目前人脸检测已取得了许多成果,如数码相机中加入了人脸检测的
随着Internet的日益普及,电子商务迅速发展。然而,电子商务产生的越来越多的商品信息使得用户越来越难快速地找到自己喜欢的产品。为解决这一难题,推荐系统应运而生,并在电子商务
优先发展公共交通已经被世界各国公认为是解决大中城市交通问题的最佳策略,它是城市可持续发展的必由之路。城市公交线网优化问题是一个多目标优化问题,涉及的目标函数复杂、约
嵌入式计算(Embedded Computing)是一类最为广泛使用的计算形式,绝大多数的处理器都应用于嵌入式计算领域。随着嵌入式应用对计算需求的不断增长,嵌入式系统也向着高性能的方
数字图像抠图技术是指把指定的前景从已有的自然图像中分离出来的一种技术,它作为图像、视频编辑的重要操作之一,用于从图像、视频等媒体文档中抠取出用户感兴趣的物体。从Smit
在实际的工程优化问题中,绝大多数都属于多目标问题。多目标优化问题中的多个目标之间存在着相互制约关系,对一个目标的优化往往以牺牲另一个目标的优化值作为代价。与单目标优
移动支付,一种在射频识别(RFID)和互连技术基础上发展起来的技术,也可称为手机支付,可定义为:“通过手机等移动通讯设备来进行交易的行为方式”。随着第三代移动通信的大规模推广
地图是空间信息的载体,在寻路过程中作为路线信息的展示工具,它扮演着重要的角色,然而,传统的地图加载了许多在寻路情形下不必要的信息,过多的细节阻碍了用户对信息的快速提取,同时