论文部分内容阅读
伴随着时代的进步与社会的不断发展,中国城市空气质量污染问题日趋明显,这直接影响到人们的身体健康乃至城市的生产发展。准确而有效地进行空气质量预测,不仅有助于为城市居民提供辅助决策信息,进而科学规划出行,更有助于为环保部门和政府部门提供环保政策的理论依据,从而更好地维护社会生产与生活环境。
本文以城市空气质量作为研究对象,梳理总结了国内外学者对城市空气质量预测的相关成果,整理分析了随机森林算法在预测方面的应用及其改进方向,阐述了随机森林算法的相关理论基础;然后基于前人的研究经验,初步选定城市空气质量的影响因素,并结合统计学理论,利用相关系数和可视化展示了各影响因素与城市空气质量指数之间的相关性大小及方向;接着,从特征选择和加权随机森林两个角度对随机森林算法进行改进,并对随机森林算法进行参数寻优,构建城市空气质量预测模型,将可决系数(R2)作为模型准确率的评价指标,将平均绝对误差(MAE)和均方根误差(RMSE )作为模型误差的评价指标;最后,利用重庆市2015年1月1日2时~2020年12月31日11时每三小时记录的相关数据进行实证分析,分别预测3小时后、6小时后、9小时后、12小时后的城市空气质量指数,并比较改进的随机森林算法与未改进的随机森林算法之间的预测准确率与预测误差,从而客观判断基于改进的随机森林算法的城市空气质量预测模型的有效性。
研究结果表明:(1)基于改进的随机森林算法的城市空气质量预测模型的预测准确率较高。在预测3小时后、6小时后、9小时后、12小时后的城市空气质量指数时,模型的可决系数(R2 )分别达到了0.83、0.75、0.68和0.61。(2)改进的随机森林算法的预测准确率与预测误差均比未改进的随机森林算法更优。在预测3小时后、6小时后、9小时后、12小时后的城市空气质量指数时,改进的随机森林算法相较于未改进的随机森林算法可决系数(R 2 )平均提升4.93%,平均绝对误差(MAE )平均降低5.75%,均方根误差(RMSE )平均降低5.36%。根据以上结论,本文所构建的基于改进的随机森林算法的城市空气质量预测模型具备较高的准确性,且比未改进的随机森林算法具备更优异的性能,可以用于城市空气质量的预测。
本文以城市空气质量作为研究对象,梳理总结了国内外学者对城市空气质量预测的相关成果,整理分析了随机森林算法在预测方面的应用及其改进方向,阐述了随机森林算法的相关理论基础;然后基于前人的研究经验,初步选定城市空气质量的影响因素,并结合统计学理论,利用相关系数和可视化展示了各影响因素与城市空气质量指数之间的相关性大小及方向;接着,从特征选择和加权随机森林两个角度对随机森林算法进行改进,并对随机森林算法进行参数寻优,构建城市空气质量预测模型,将可决系数(R2)作为模型准确率的评价指标,将平均绝对误差(MAE)和均方根误差(RMSE )作为模型误差的评价指标;最后,利用重庆市2015年1月1日2时~2020年12月31日11时每三小时记录的相关数据进行实证分析,分别预测3小时后、6小时后、9小时后、12小时后的城市空气质量指数,并比较改进的随机森林算法与未改进的随机森林算法之间的预测准确率与预测误差,从而客观判断基于改进的随机森林算法的城市空气质量预测模型的有效性。
研究结果表明:(1)基于改进的随机森林算法的城市空气质量预测模型的预测准确率较高。在预测3小时后、6小时后、9小时后、12小时后的城市空气质量指数时,模型的可决系数(R2 )分别达到了0.83、0.75、0.68和0.61。(2)改进的随机森林算法的预测准确率与预测误差均比未改进的随机森林算法更优。在预测3小时后、6小时后、9小时后、12小时后的城市空气质量指数时,改进的随机森林算法相较于未改进的随机森林算法可决系数(R 2 )平均提升4.93%,平均绝对误差(MAE )平均降低5.75%,均方根误差(RMSE )平均降低5.36%。根据以上结论,本文所构建的基于改进的随机森林算法的城市空气质量预测模型具备较高的准确性,且比未改进的随机森林算法具备更优异的性能,可以用于城市空气质量的预测。