论文部分内容阅读
遥感技术发展至今已经取得了巨大的进步,不论是在轨卫星的类型还是数量都非常多,因此可方便地获取大量不同类型遥感影像数据。虽然我们拥有了海量的遥感影像数据,但并不代表我们直接就可以从海量的遥感影像中挖掘出知识并服务于农作物遥感识别过程。鉴于农作物遥感识别本身的特点,我们需要对海量的多源数据进行同化处理和结构化管理,此外我们还需要海量的样本数据、地面调查数据以及其他类型的数据,并对这些数据进行结构化管理。在此基础之上运用机器学习等技术促使农作物遥感识别应用更加智能化。 为解决农作物遥感识别过程中的数据积累问题与机器学习等概念在农作物遥感识别中的应用,本文以农业遥感中作物识别为例,设计构建了特征知识库系统,旨在使用智能化的方式提高大宗作物的识别精度和速度。首先、特征知识库系统将多源、多时相的遥感数据进行同化预处理并且进行结构化管理,对影像的训练样本、地面调出数据等也进行结构化存储,系统完成后可支持不同条件的数据检索,包括影像检索、样本检索、模型检索等。最终特征库中存储21966条地面调查与样本数据,496景影像数据,作物类型包括了水稻、小麦、玉米、甘蔗、大豆。其次,通过研究特征评价与优选的方法对特征进行评价和优选,针对不同的作物寻找出最佳的特征子集。本文结合过滤模型与封装模型的优点,提出同时使用一致性原则和随机森林方法进行农作物遥感识别特征优选的模型。然后根据选定的最优特征子集训练影像分类模型、并将该最佳模型进行存储,以便重复利用。最后,系统实现了六种不同的影像分类算法,其中包括四种常见的机器学习算法和两种传统的计算机分类方法。文章对比分析了农作物分类场景中这几种集成学习算法的表现,并详细分析了不同方法的优缺点,寻找出最佳的适合于农作物分类场景的机器学习算法,研究结果表明:随机森林(RF)方法以及梯度提升树(GBDT)方法的总体分类精度与Kappa系数都在90%以上;从时间方面来看,随机森林方法和梯度提升树方法的运行时间随着子分类器数目的增加而缓慢增加,总体来说用时较少,所以随机森林和梯度提升树方法可用于大规模的农作物遥感识别过程中。