论文部分内容阅读
高光谱遥感技术是20世纪80年代以来对地观测领域出现的一种新型的遥感技术,是目前遥感技术发展的前沿之一。高光谱遥感具有较高的光谱分辨率和连续的光谱覆盖特性,使得在传统的多光谱遥感领域中不可探不可测的物质在高光谱遥感中很容易被探测到,其提供的海量数据信息大大提高了数据分析的质量和可信度。目前,高光谱遥感技术已经广泛应用在地理学、地质学、生态学、农业科学等领域的研究和应用当中。
高光谱遥感的分类研究是遥感应用领域的热点之一。其主要是通过遥感数据所提供的信息对地物进行分类,即对地物目标的物理属性进行识别。遥感数据分类经过几十年的研究和发展已经形成了十分丰富的理论和方法,并在多光谱遥感领域取得了成功,然而,受限于多光谱遥感所提供的信息量,很难对地物间的微小差异进行精细识别。而高光谱遥感的出现提供了前所未有的大量信息,为地物理化特性的深层探索提供了可能。
与传统的遥感技术相比,高光谱遥感数据具有光谱分辨率较高、波谱宽度窄、数据信息量大等优势,但有碍于物理设备的局限、大气水汽吸收的影响、波段相关性强等特点,也造成了噪声增加、冗余增多的弊端,这些都对高光谱遥感的数据解译和有效利用造成了困难,也使得传统的多光谱遥感分析方法和常用的数理统计方法在高光谱的研究中不能完全适用。因而,如何更加有效且快速准确的利用高光谱遥感数据所提供的最大信息,研究适合于高光谱遥感数据分类的处理方法和技术,是高光谱遥感技术研究的主要热点和发展方向。
近年来,随着机器学习和数据挖掘技术的飞速发展,越来越多的智能研究方法被引入到高光谱遥感的研究当中。与传统的数理统计和专家方法不同,智能方法更加自动化,具有更强的可操作性,而且可以大大减少人力的投入和消耗。目前,人工神经网络、决策树、支持向量机等方法均已应用在高光谱遥感数据当中,并取得了不错的分类处理效果。“基于智能算法的高光谱数据处理软件”首次创新性的将演化算法与高光谱遥感技术相结合,形成了一套全新的高光谱遥感铀矿床识别技术。
随着机器学习和数据挖掘技术研究领域的不断深入,针对不同问题的新的研究方法不断涌现,迁移学习即是一门新兴的机器学习研究方法。相比于传统的机器学习方法,迁移学习并不要求训练数据集和测试数据集遵循一样的分布,这也更符合现实生活中的应用情况。依托互联网产业的高速发展,迁移学习已经广泛应用在文本分类、图像识别和Web数据挖掘当中。在铀矿床高光谱遥感分类的应用研究中,现有的分类先验知识并不充足,存在大量无类标记的数据,且由于成矿原因等不同,其训练数据集和测试数据集的概率分布也不尽相同,正好可以将迁移学习的方法引入其中,从而充分利用已有物质分类的先验知识,根据地理地表蚀变成因的不同,将原有的识别分类模型迁移到铀矿床的识别当中,以期取得较好的效果。进而,根据迁移学习的基本原理,利用合理的先验知识,适当的根据新的目标域数据调整模型,便可以将类似的、具有一定相关性的地物及矿物识别体系引入到其他类型的物质识别当中。本论文通过对铀矿床数据、人工数据、遥感数据和文本数据的实验表明,通过迁移学习,可以在现实应用的数据分类中取得较好的实验效果。
本论文依托于国家高技术研究发展计划(863计划)课题“基于演化数据挖掘的铀矿床高光谱遥感信息自动提取技术研究”,专注于对迁移学习算法的研究,并顺利的将其应用在高光谱遥感数据智能分类的研究当中。我国是铀矿资源不甚丰富的一个国家,作为一种重要的战略性资源,铀矿在我国国防和经济建设中都扮演着举足轻重的作用。因而,如何通过智能的方法合理利用高光谱遥感所提供的丰富信息,以低成本、高效率的方式发现铀矿储备是当前铀矿科研中亟待解决的重大课题。本论文在国家863计划课题的科技研究成果之上,创新性的提出将迁移学习的方法应用到铀矿床高光谱遥感数据的分析处理过程中,取得了较好的实验效果。本论文的具体研究工作主要包括以下几个方面:
1.描述了高光谱遥感数据的基本概念,讨论了遥感数据的获取和预处理问题。以甘肃芨岭地区的701和706铀矿床Hyperion高光谱数据作为来源,对Hyperion卫星数据中由于传感器、大气水汽、数据转换过程中所产生的错误和误差数据进行剔除和修复。介绍了高光谱遥感数据预处理的流程和原理,讲述了水汽去除,坏线修复、条纹去除、smile效应去除、大气校正和几何校正的基本原理和方法,最终得到了可以进一步操作和使用的反射率数据。
2.对迁移学习的基本原理和优势进行了介绍,对比了迁移学习和传统机器学习的异同,讲解了迁移学习适用的环境和条件,并对负迁移和现行的研究成果进行了简单的介绍。
3.介绍了TrAdaboost算法的基本思想和原理,提出了将wagging算法和TrAdaboost算法相结合的TrMultiBoost改进算法,为TrAdaBoost算法增加了抖动效应。并在实验研究中取得了一定效果。
4.在TrAdaBoost算法中加入重采样算法,提出了一种改进的TrResample算法,在每次迭代前,首先对源域样本进行加权重采样,通过重采样可以提取出会更加有利于目标域学习的样本,使其对目标域数据训练的贡献增加,在目标域数据样本不足的情况下可以为源域提供更多优质的辅助数据。在实验中,可以看出,加入重采样算法后可以有效的提高目标域的训练精度。
5.在铀矿床高光谱遥感数据上进行了实验研究,实验结果表明,将迁移学习应用到高光谱遥感数据分类中可以取得不错的实验效果。