基于随机森林的上海市PM2.5质量浓度预测研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:beryl1830
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的快速发展,工业化和城市化进程加快,以PM2.5为主的大气污染问题日益突出。雾霾等大气污染问题不仅严重影响了人们的日常生活和身体健康,也对社会的可持续发展造成了巨大冲击。因此,实现对大气中污染物浓度的精准预测具有重要的现实意义和社会价值。本文从以下几方面对上海市Pm2.5质量浓度进行了研究:首先,对于原始数据中存在的缺失值,本文综合考虑了其他因素对于缺失值的影响,使用KNN算法对其进行了填充,填充后的数据与原数据的波动规律基本吻合。其次,本文从月际和周际的时间尺度分析了上海市PM2.5的分布变化规律,分别总结出上海市每月平均PM2.5浓度变化、每月空气质量等级占比、一周内每一天的PM2.5浓度变化。然后,分析了 Pm2.5与其他污染物、PM2.5与气象因素之间的相关关系,并计算其Pearson相关系数矩阵,确定了 PM2.5与其他因子间相关性的大小与方向。同时,建立以赤池信息准侧为判停标准的逐步回归仿真方程,并对回归假设做出诊断。实验表明,气象因子和离子浓度因子的加入使逐步回归仿真方程的拟合优度从66%提升至85%。最后,利用随机森林算法建立用于PM2.5质量浓度预测的逐小时模型和极值模型,分别对未来1~6小时每小时的PM2.5质量浓度以及6~12小时、12~24小时、24~48小时的PM2.5质量浓度最大值和最小值进行预测。实验表明,随机森林算法的预测精度在90%以上,相较于基准模型,精度最大提升30%。通过基于OOB误差估计的变量筛选方法选择出最优预测变量子集,可以使模型的拟合优度平均提升1.05%。
其他文献
随着互联网金融逐步发展,P2P网络借贷作为一种创新的互联网金融模式在当下变得炙手可热。近年来,凭借着高收益、便捷等理财优势,各类P2P网络借贷平台得到了爆发式增长。然而,
<正> 啤酒有上而发酵啤酒和下面发酵啤酒之分,由于下而发酵啤酒风味比较好,所以世界各国都生产这种啤酒,尤其欧洲各国最为普遍。下面发酵啤酒的生产方法如下:用麦芽和淀粉质
本文按《城镇供热管道工程技术规程》中有关强度计算理论的内容,对无固定支座直埋供热管道的设计布置、计算方法进行了深入分析推导,对优化直埋供热管网设计,降低投资,提高管网可
聚酰亚胺(PI)是一类具有独特结构的高性能材料,如今被广泛用于高新技术领域,但由于PI难以溶解及融熔导致加工困难,同时其粘接性能不佳以及原料成本高昂因而限制了PI材料的进
随着智能手机的出现以及移动互联网的快速发展,用户连接网络的方式也在逐渐发生变化,由PC端向移动端转移。现如今智能手机与传统PC相比,已不仅仅是简单的通信工具,PC端的很多
随着全球经济和现代网络信息技术的不断发展,促进了电子商务的产生,一个基于网络的市场正在快速形成,其前景和潜力都十分巨大。作为全国经济的重要组成部分,也是在互联网上最
老字号是经过历史沉淀、拥有悠久历史与经济价值的商业文化共同体。食品企业老字号在全国老字号企业中所占比重较大。有着悠久历史的福建省,拥有众多老字号企业,其中,厦门市
随着信息化时代的到来,新媒体层出不穷,传统的报纸新闻在面临众多挑战的同时进入了“读题时代”。标题作为新闻的重要有机组成,有“文好题一半”“文靠题妆”等形象的说法,从
目的探讨患者手术期皮肤压疮的防治措施。方法选择术前评估可能有压疮发生或手术时间较长的患者100例,骨突处垫棉垫,无需按摩涂中药制剂。结果通过对术后受压皮肤的观察记录,
目的 :探究腰骶段选择性脊神经后根切断术(SPR)对脑瘫患者的下肢痉挛状态及粗大运动功能的改善情况。方法:回顾性分析2018年1月至2018年10月分别采用单纯康复治疗和腰骶段选