论文部分内容阅读
目前我国已经进入了后工业化的时代,但与之相随而来的是环境与发展的极度不和谐,环境在发展过程中受到了巨大的破坏,尤其表现在我们赖以生存的空气、土壤、水等方面。近些年,空气质量急剧恶化,雾霾以越来越高的频率、越来越大的范围出现在全国各地,通过呼吸系统对人体健康造成严重的危害。而随着生活水平的提高,人们对于环境的关注越来越高,对于自己生活区域的环境质量的要求也随之升高,空气质量成为人们关注的焦点问题。本文以此为出发点,对我国现有累积的大量历史空气质量数据进行挖掘,寻找PM2.5与其他空气污染物间的非线性关系,针对PM2.5小区域范围内质量浓度差距大、民众难以及时得到预报信息等问题,对PM2.5每小时的质量浓度进行预测。本文主要完成的工作如下:(1)根据PM2.5的形成原因,分析可以引起其质量浓度变化的因素,建立数学模型。可入肺颗粒物PM2.5的成因复杂,组成成分包含直接排放的一次粒子以及由光化学反应形成的二次粒子,主要包括有机碳、元素碳、土壤尘、硫酸铵或亚硫酸铵、硝酸铵、铵盐、半挥发性有机物等。结合监测站所监测空气污染物,最终选取CO、N02、03-1、03-8、S02、PM10六种污染物,作为PM2.5质量浓度的影响因子。(2)获取空气环境污染物历史监测数据,并对数据进行预处理。在监测数据中,会出现偶然的异常数据条,比如监测值全为零的空数据。在使用数据前需要对异常数据进行剔除,以免影响之后的预测结果。对剔除后数据的进行归一化处理,让不同数量级的数据在一个范围内取值,避免由于数量级的差距产生的预测误差。对样本数据进行划分,以合适的比例将其分为训练数据集和测试数据集。选择合适的预测分析工具,由于本研究中需要对大量数据进行高速、高效的矩阵运算处理,故选择Matlab作为主要工具。(3)研究神经网络,分析神经网络的原理、执行流程、参数设置、运算过程,使用反向传播神经网络作为基础进行预测。通过经验公式以及试错法确定该网络的最佳隐含层神经元个数,设计最佳网络结构;根据函数的适用范围,选择合适的传递函数、训练函数、学习函数。使用训练数据对网络进行训练,在网络训练结束后,使用sim()函数以及测试集对训练好的网络进行测试预测。最后,将网络的预测结果进行统计,计算其预测结果的可接受度、相对误差,分析网络性能、优缺点。(4)针对BP神经网络的缺点,提出改进的神经网络,使用模糊系统、遗传算法对神经网络进行优化。模糊系统将神经网络进行模糊化处理,即模糊其网络输入及连接权值,明晰网络的推理过程,解决神经网络求解问题时的黑箱特性。将神经网络的输入/输出作为模糊系统的输入/输出,用神经网络的隐含节点表示隶属度函数和模糊规则。遗传算法对神经网络的初始连接权进行优化,提高网络的全局搜索能力、收敛速度,解决神经网络容易陷入局部最小的问题。该算法需要根据网络的进化目标,选择与其相匹配的个体适应度函数以及进行遗传操作的方法,最终,将最优的初始连接权赋值给神经网络。(5)在Matlab下编写完整的优化后的神经网络的.m程序,将预处理后的数据输入网络进行训练、测试。分别对拟合结果以及测试结果进行分析,在保证网络没有出现过拟合的情况下,对三种方法的预测结果进行统计、对比分析。数据结果表明,使用遗传算法优化的神经网络在PM2.5质量浓度预测上的表现最佳,提高了预测结果的精确度,降低了其误差率。