论文部分内容阅读
近年来,空气污染日益恶化,严重阻碍我国的社会发展。有效地监控空气质量,准确地预测空气污染物浓度对我国的经济发展和国民健康十分重要。现有的数值预测模型虽然能够较好地实现空气质量预测,但需要详细准确的污染物排放清单,而我国大部分环境保护部门无法做到。基于历史监测数据模型的空气质量预测方法适合我国现阶段的发展需要,也是对数值预测模型的有效补充。 本文依靠历史监测数据,应用机器学习和集成学习算法寻求预测空气污染物浓度理想模型,并寻找模型参数优化规律。 本文主要的工作在于: 首先,确定了研究路线及备选机器学习算法。根据国内外研究情况、机器学习算法特点初步筛选出用作实验的学习算法集合。根据现有模型选择原则和方法,确定本文模型选择思路和策略。 其次,基于空气质量历史监测数据,进行大量实验,筛选适合常见污染物浓度预测模型。论文进行三类实验,分别是单一算法建模、Bagging集成学习算法建模和Stacking集成学习算法建模,并通过特定判断标准将三类训练生成的模型进行性能比较,筛选出性能较好的模型。 第三,对于筛选出的模型给出参数优化方法。分析三类训练方式的优缺点,并对筛选出的较好模型进行参数优化实验,找到参数调优的规律和方法。 最后,开发基于上述研究的空气质量预测系统软件。根据使用工具Weka在实际应用中的缺陷,在Weka源码基础上进行了二次开发,编写出针对空气污染物浓度预测的应用程序。 本研究的意义在于,利用机器学习和集成学习算法进行空气污染物浓度预测无需详细污染物排放清单就可取得较好效果,是对数值预测模型的有效补充,具有一定的应用价值。