论文部分内容阅读
随着工农业生产的发展,环境污染问题日益突出,其中水污染是目前全球面临的严重环境问题之一。空间遥感技术的发展为大规模、动态、连续地监测地表水体水质提供了便捷、经济的方法。以前,利用遥感影像对水质的监测研究主要是针对海湾、湖泊、水库等大面积的水体;现在随着遥感影像分辨率的提高,小面积水体的监测也成为可能。渭河流经陕西经济最为发达的关中地区,因此,对其进行精确的水质参数定量遥感监测有着重要的现实意义。本文基于传统统计理论和机器学习方法,利用渭河水质实地监测历史数据及与其时间同步或·准同步的SPOT-5卫星遥感影像数据,分别建立了用于预测水质参数(化学需氧量(COD)、高锰盐指数(CODmn)、溶解氧(DO)和氨氮(NH3-N))浓度的线性和非线性回归模型。回归反演结果表明,实地监测数据与影像数据之间存在着复杂的非线性关系。为了提高渭河水质参数定量遥感反演精度,本文引入了集成学习这一新的机器学习范式,并在现有集成方法的基础上,提出了基于样本重构的人工神经网络加权平均集成方法和采用二重扰动机制的支持向量机选择性集成方法,使集成模型的预测精度得到进一步提高。本文的研究内容包括以下几个方面:(1)综述了国内外水质遥感监测研究概况,介绍了集成学习及其主要算法;(2)对水质实地监测数据和遥感影像数据做了正态分布分析,建立了基于传统统计理论的逐步线性回归模型,并在模型建立前、后,均对异常点进行了检测;(3)典型的Bagging、Boosting和基于样本重构的简单平均集成方法几乎总能改善神经网络的泛化能力。为了获得更好的泛化性能,本文在基于样本重构的简单平均集成方法的基础上,根据各成员神经网络的预测精度和差异度赋予其以不同权重,提出了基于样本重构的神经网络加权平均集成方法;(4)对于本文的水质参数回归预测问题,采用典型的Bagging和Boosting对支持向量机这种稳定的强学习器进行集成,不能改善其泛化性能。通过对样本和支持向量机模型参数的二重扰动得到成员学习器,并选择预测精度较高的若干成员学习器加以集成,使单支持向量机的泛化能力得到明显提高;(5)比较了几种回归模型的泛化能力,并利用基于样本和参数二重扰动的支持向量机选择性集成模型分别对四个渭河水质参数进行定量遥感反演,得到了和实际情况较吻合的结果,表明了集成方法的可行性和有效性。