常见污染物浓度集成学习预测模型研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:sun18903827600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,空气污染日益恶化,严重阻碍我国的社会发展。有效地监控空气质量,准确地预测空气污染物浓度对我国的经济发展和国民健康十分重要。现有的数值预测模型虽然能够较好地实现空气质量预测,但需要详细准确的污染物排放清单,而我国大部分环境保护部门无法做到。基于历史监测数据模型的空气质量预测方法适合我国现阶段的发展需要,也是对数值预测模型的有效补充。  本文依靠历史监测数据,应用机器学习和集成学习算法寻求预测空气污染物浓度理想模型,并寻找模型参数优化规律。  本文主要的工作在于:  首先,确定了研究路线及备选机器学习算法。根据国内外研究情况、机器学习算法特点初步筛选出用作实验的学习算法集合。根据现有模型选择原则和方法,确定本文模型选择思路和策略。  其次,基于空气质量历史监测数据,进行大量实验,筛选适合常见污染物浓度预测模型。论文进行三类实验,分别是单一算法建模、Bagging集成学习算法建模和Stacking集成学习算法建模,并通过特定判断标准将三类训练生成的模型进行性能比较,筛选出性能较好的模型。  第三,对于筛选出的模型给出参数优化方法。分析三类训练方式的优缺点,并对筛选出的较好模型进行参数优化实验,找到参数调优的规律和方法。  最后,开发基于上述研究的空气质量预测系统软件。根据使用工具Weka在实际应用中的缺陷,在Weka源码基础上进行了二次开发,编写出针对空气污染物浓度预测的应用程序。  本研究的意义在于,利用机器学习和集成学习算法进行空气污染物浓度预测无需详细污染物排放清单就可取得较好效果,是对数值预测模型的有效补充,具有一定的应用价值。
其他文献
知识发现(KDD,Knowledge Discovery in Database)是从数据中获取知识的一种智能信息处理技术。分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来
信号瞬时特征的提取在信号处理中具有重要的意义,然而复杂信号特别是非线性和非稳定信号真正意义上瞬时参数的定义都比较困难,更谈不上高精度测量信号的瞬时参数。如何利用数据
车间作业调度问题(JSP)是许多实际问题的简化模型。寻找求解JSP问题的有效途径是调度和优化领域的重要课题。但是车间作业调度问题是NP难解问题,寻找具有多项式复杂度的算法几
移动无线Ad hoc网络是一种特殊的临时性的自组网络,该网络由一系列的带有无线收发装置的移动终端节点组成。该网络最大的特点是不需要固定的基础设施的支持,无需中心控制管理。
分布式异构数据源的集成涉及到多个软件领域,通过分布式构件技术在数据源之上建立数据访问中间层,可使集成体系具有优越的性能和良好的可扩展性。论文基于CORBA和Web Services
随着当前企业应用的快速发展,对软件的需求越来越高。在企业应用软件开发中,用户界面的开发占有的工作量很大。提高用户界面的开发效率无疑是提高整个软件开发效率的有效手段。
信息过载和资源迷向己经成为制约人们高效使用Internet信息的瓶颈。信息过载是指用户面对太多的信息难以及时地消化、吸收;资源迷向是指用户不知道如何确切地表达对网上资源
现如今,随着海上石油开采的兴起以及海上石油运输的繁荣,诸如船舶海损事故、海上石油平台泄漏事故、沿岸石油储运设备事故等海上溢油事故频发,针对事故所造成的经济、环境损
Web服务是基于网络的、分布式、自包含、自描述、模块化的应用程序,具有良好的封装性和松耦合性。随着Web服务研究的不断深入,供应商提供的单个服务越来越难满足用户的实际需
模体发现在系统进化、基因调控等领域处于核心地位。模体中蕴含丰富的生命遗传信息,由于其长度,位置,变异的不确定性,模体发现问题仍然是一个难点。本文分析了聚类应用在模体发现