论文部分内容阅读
摘 要:空气质量问题越来越引起各界关注,依据蚌埠市PM2.5的各项监测数据,参照我国新修订的《环境空气质量标准》的标准和要求,对蚌埠市对空气中各污染物的相关性进行定性和定量分析,并对PM2.5与PM10,氮氧化物等因素进行相关性分析和检验,建立PM2.5 与CO、SO2、NO2、PM10等因素之间的多元线性回归模型,并建立高斯扩散模型,刻画出蚌埠市空气中PM2.5的时空分布规律,并对该地区进行污染的评估,最终得出含有风力、湿度等因素的多元线性回归模型。最后运用对比法,将实际检测出来的数据与模型计算出来的模拟值进行比较与检验,并对模型的优缺点进行了评价。
关键词:AQI;Pearson相关系数;多元线性回归
中图分类号:TB 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2018.17.091
1 引言
随着我国GDP保持着高速稳定的增长,另一方面,环境污染问题也逐渐引人关注。这主要是因为经济增长方式出现问题,传统工业发展方式较为守旧落后,主要能源消费以煤炭石油等为主,必然导致大量的废气污染物排放。这对建设绿色循环经济产生了一定破坏作用,不利于生态良好发展,不利于建设环境友好型社会。废气排放,管控不当使空气污染的问题更加突出,尤其是近几年频繁出现的雾霾天气,在一定程度上对居民身体健康也造成了一定威胁。通过对PM2.5的相关影响因素分析和分布与演变规律分析可以找到治理PM2.5的更科学便捷的方式,从而对其他地区的空气污染治理有前车之鉴,提供了应用范例。除此之外,社会各界对空气检测监管也十分关注,相应的政策也得到出台建立,相关的法律法规及污染管理方式也已明文规定,特别是2012年新修订的《环境空气质量标准》,首次采用空气质量指数这个概念,将其作为污染治理中空气检测的指标,主要包括对空气中的颗粒物、臭氧O3和一氧化碳CO 等6 项的检测。因此,本文在政策及标准建立的基础上,从监测指标角度着手进行分析。传统空气环境污染物问题治理对策有:植树种草、火电厂污染源控制、农作物的控制燃烧处理、工业排放污染的控制、汽车污染源的控制等。三线城市在我国比重占多数,蚌埠市作为安徽省这个人口大省的第三城市,其污染雾霾等问题具有代表性、典型性,对该地区的治理,对其他三线城市有很好的应用和借鉴效果,给同类城市提供了预防和处理环境问题的方式该地区空气中PM2.5问题的研究具有重要意义。
2 主要指标符号说明
xi:表示第i个污染物指标的含量;y:PM2.5含量模拟值;bi:第i个污染物的线性相关系数;R :拟合优度系数;F: F检验值;σx:x轴方向扩散系数;σy:y轴方向扩散系数;u:平均风速。
3 模型的构建
3.1 相关性模型
我们收集到蚌埠市空气质量指数AQI中6个基本监测指标,得到一天内各个时刻的平均值,利用SPSS软件对数据进行相关性处理,得到各指标因素之间的相关性成都,并根据相关性分析结果选取对应指标建立多元线性回归模型。
同时,在对空气质量指数基本监测指标的分析基础上,对于PM2.5具有高度相关的检测指标进一步做定量分析。由于选取的指标变量数据较少,我们明显发现,PM2.5与相应的5个指之间含量的变化态势相似,存在一定的线性变化关系。
将原始数据进行标准归一化处理,用Pearson相关系数来衡量AQI中6个基本检测指标的相关性。通过软件运行得到结果,得到PM2.5含量与PM10、NO2、SO2、CO相关系数均大于0.8,具有高度的相关关系,PM2.5与臭氧相关系数极弱,因此本文将不考虑臭氧对PM2.5的影响,在建立模型的过程中忽略臭氧因素对模型结果的影响。
3.2 多元线性回归模型
多元线性回归模形即含有多个变量的线性回归模型。在理论形式下,可以认为因变量Y与自变量x1,x2,…xk得到多组观测值中的数据满足:yj=b0+b1x1j+b2x2j+…+bpxpj+εj(j=1,2,3,…,n),式中的εj为相互独立且都服零均值同方差的正态分布随機变量。
由PM2.5与其他因子的相关性分析结果得到的结果,利用MATLAB软件进行多元线性回归拟合,其中自变量为x1,x2,…,x4(PM10,NO2,SO2,CO),因变量为y,对剔除异常预处理后的数据进行回归拟合,可以得出:R =0.9602、 F=42.2231、 p=0.0001。
本文用复相关系数R 来衡量回归方程与观测值拟合的优良程度,结果中R >0.85,F的值较大,p=0.0001<0.05,以上三点的结果说明该曲线的线性关系显著,该回归模型具有统计学意义,模型成立。
得到该多元线性回归模型的结果如下,从模型中可以看出PM2.5与其他四个变量之间的定量分析结果为:每增加1单位的PM10,PM2.5增加0.7627个单位;每增加1单位的二氧化氮,PM2.5增加0.0819个单位;每增加1单位的二氧化硫,PM2.5减少0.8173个单位;每增加1单位的CO,PM2.5减少45.8211个单位。
y=27.8126+0.7627x1+0.0819x2-0.8173x3-45.8211x4
3.3 高斯扩散模型
该理论假定污染物是从某区域附近泄漏,且泄露的排放量Q(单位ug/s),风速大小u不随时间、地点和高度的变化而变化。由气体扩散空间任意一点(x,y,0),得到污染源扩散气体的浓度。结合实际,在风力、湿度等天气条件下,合理考虑这些因素对蚌埠市PM2.5成因等规律的影响。
查阅资料可得,蚌埠市的共6个监测点(蚌埠学院、淮上区政府、百货大楼、工人疗养院、高新区、二水厂),监测搜集到每天4个不同时段(上午、中午、晚上、凌晨)的PM2.5日均含量分布数据。分别得到蚌埠PM2.5的时空分布和规律图,蚌埠市平均湿度、风力和PM2.5分别随时间变化规律图,见图1、图2。 通过蚌埠市PM2.5时空分布图可见,蚌埠市6个环境监测点PM2.5含量有基本一致的变化幅度和趋势,随着时间的推移变化(上午—中午—晚上—凌晨),蚌埠市PM2.5的时空分布呈现波动下降趋势,从上午至晚上期间,6个环境监测点的PM2.5浓度逐渐降低,至晚上是达到该日最低含量,随后空气中PM2.5浓度开始上升。其中,百货大楼、二水厂、高新区的PM2.5浓度总体较高,工人疗养院的PM2.5浓度变化范围最广,波动最高和最低浓度值也是最显著地,淮上区政府和蚌埠学院的两个监测点PM2.5浓度整体较低,每天的波动范围相对较小。结合《环境空气质量标准》,根据环境空气功能区质量要求得到环境空气污染基本项目浓度限值,可以推断出蚌埠市6个监测点24小时平均PM2.5浓度都属于二类区,均在35-75ug/m3内分布,满足二级空气质量要求。综合来看,时间和天气情况的变化也会对PM2.5浓度产生一定程度的影响,以此类推,季节变化也应是影响空气质量的重要因素,也就是说风力、湿度成为影响PM2.5含量的不可忽略因素。
在主要考虑风力和湿度的影响下,本文继续对蚌埠市的PM2.5浓度进行双因素分析。结合前面建立的多元线性回归模型,增加变量x5,x6(湿度,风力),利用MATLAB软件求解得到新的多元线性回归模型。得到 多元回歸曲线的拟合结果:b0=38.1092,b1=0.6498,b2=0.1842,b3=-0.8166,b4=-0.0307,b5=-0.1443,b6=-2.0151,R =0.9641,F=22.3930,p=0.0018。
可见,蚌埠市空气中PM2.5浓度与NO2、PM10浓度有正比关系,与空气中CO、SO2含量以及风力、湿度大小成反比,且风力对PM2.5的含量影响比湿度的影响大。因此,本文建立的多元线性回归模型符合统计学规律,综合最终的模型为:
y=38.1092+0.6498x1+0.1842x2-0.8166x3-0.0307x4-0.1443x5-2.0151x6
4 模型的检验
为了检验所建立的模型和运用方法的合理性与科学性,本文运用对比法,将实际检测出来的数据与模型计算出来的模拟值进行比较。得到以下是重新随机采取的多组实际数据,以及对应实际值与模拟值。由于篇幅限制本文仅给出4组随机实验数据,具体见表1。
通过与实际值进行比较发现,这四组数据的模拟值与实际值在一定程度上是高度拟合的,拟合精度分别为99%、94%、97%、99%,均保持在94%以上的准确率,具有较高的拟合精度,因此该模型是合理的。
5 模型的评价
(1)优点:利用相关数据软件对数据进行处理并作出各种平面图,使相关描述结果更加直观,更易于理解,运用MATLAB、SPSS等数学软件依据模型进行计算,提高工作效率。
(2)缺点:数据选取相对较少,代表性不够强烈,误差大,对于污染物的选取只选择了6项主要的污染因子,对于其他部分(季节因素等)的污染物采取了忽略处理,对最后的模型建立结果有一定的影响因素。在模型的建立中,我们的考虑并不全面,这样无疑会造成计算结果不准确。对于问题一,我们针对蚌埠市PM2.5的含量以及其他5个因素建立了多元线性回归模型,得出了PM2.5的含量与主要指标因素的线性关系,过程中我们并没有考虑到各指标因素之间的内部的相关影响,因此所得到的模型也不够精确,需要进一步改进。
参考文献
[1]张恒斌,杨敏,魏换其.空气中PM2.5问题的研究[J].广西师范学院学报:自然科学报,2014,31(4):97-99.
[2]李勇,宋慧,李玉珍,丁伟利.西安市空气PM2.5问题研究[J].黑龙江大学自然科学学报,2014,31(2):236-237.
[3]王玮,汤大钢,刘红杰.中国PM2.5污染状况和污染特征的研究[J].环境科学研究,2000,13(1): 1-5.
关键词:AQI;Pearson相关系数;多元线性回归
中图分类号:TB 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2018.17.091
1 引言
随着我国GDP保持着高速稳定的增长,另一方面,环境污染问题也逐渐引人关注。这主要是因为经济增长方式出现问题,传统工业发展方式较为守旧落后,主要能源消费以煤炭石油等为主,必然导致大量的废气污染物排放。这对建设绿色循环经济产生了一定破坏作用,不利于生态良好发展,不利于建设环境友好型社会。废气排放,管控不当使空气污染的问题更加突出,尤其是近几年频繁出现的雾霾天气,在一定程度上对居民身体健康也造成了一定威胁。通过对PM2.5的相关影响因素分析和分布与演变规律分析可以找到治理PM2.5的更科学便捷的方式,从而对其他地区的空气污染治理有前车之鉴,提供了应用范例。除此之外,社会各界对空气检测监管也十分关注,相应的政策也得到出台建立,相关的法律法规及污染管理方式也已明文规定,特别是2012年新修订的《环境空气质量标准》,首次采用空气质量指数这个概念,将其作为污染治理中空气检测的指标,主要包括对空气中的颗粒物、臭氧O3和一氧化碳CO 等6 项的检测。因此,本文在政策及标准建立的基础上,从监测指标角度着手进行分析。传统空气环境污染物问题治理对策有:植树种草、火电厂污染源控制、农作物的控制燃烧处理、工业排放污染的控制、汽车污染源的控制等。三线城市在我国比重占多数,蚌埠市作为安徽省这个人口大省的第三城市,其污染雾霾等问题具有代表性、典型性,对该地区的治理,对其他三线城市有很好的应用和借鉴效果,给同类城市提供了预防和处理环境问题的方式该地区空气中PM2.5问题的研究具有重要意义。
2 主要指标符号说明
xi:表示第i个污染物指标的含量;y:PM2.5含量模拟值;bi:第i个污染物的线性相关系数;R :拟合优度系数;F: F检验值;σx:x轴方向扩散系数;σy:y轴方向扩散系数;u:平均风速。
3 模型的构建
3.1 相关性模型
我们收集到蚌埠市空气质量指数AQI中6个基本监测指标,得到一天内各个时刻的平均值,利用SPSS软件对数据进行相关性处理,得到各指标因素之间的相关性成都,并根据相关性分析结果选取对应指标建立多元线性回归模型。
同时,在对空气质量指数基本监测指标的分析基础上,对于PM2.5具有高度相关的检测指标进一步做定量分析。由于选取的指标变量数据较少,我们明显发现,PM2.5与相应的5个指之间含量的变化态势相似,存在一定的线性变化关系。
将原始数据进行标准归一化处理,用Pearson相关系数来衡量AQI中6个基本检测指标的相关性。通过软件运行得到结果,得到PM2.5含量与PM10、NO2、SO2、CO相关系数均大于0.8,具有高度的相关关系,PM2.5与臭氧相关系数极弱,因此本文将不考虑臭氧对PM2.5的影响,在建立模型的过程中忽略臭氧因素对模型结果的影响。
3.2 多元线性回归模型
多元线性回归模形即含有多个变量的线性回归模型。在理论形式下,可以认为因变量Y与自变量x1,x2,…xk得到多组观测值中的数据满足:yj=b0+b1x1j+b2x2j+…+bpxpj+εj(j=1,2,3,…,n),式中的εj为相互独立且都服零均值同方差的正态分布随機变量。
由PM2.5与其他因子的相关性分析结果得到的结果,利用MATLAB软件进行多元线性回归拟合,其中自变量为x1,x2,…,x4(PM10,NO2,SO2,CO),因变量为y,对剔除异常预处理后的数据进行回归拟合,可以得出:R =0.9602、 F=42.2231、 p=0.0001。
本文用复相关系数R 来衡量回归方程与观测值拟合的优良程度,结果中R >0.85,F的值较大,p=0.0001<0.05,以上三点的结果说明该曲线的线性关系显著,该回归模型具有统计学意义,模型成立。
得到该多元线性回归模型的结果如下,从模型中可以看出PM2.5与其他四个变量之间的定量分析结果为:每增加1单位的PM10,PM2.5增加0.7627个单位;每增加1单位的二氧化氮,PM2.5增加0.0819个单位;每增加1单位的二氧化硫,PM2.5减少0.8173个单位;每增加1单位的CO,PM2.5减少45.8211个单位。
y=27.8126+0.7627x1+0.0819x2-0.8173x3-45.8211x4
3.3 高斯扩散模型
该理论假定污染物是从某区域附近泄漏,且泄露的排放量Q(单位ug/s),风速大小u不随时间、地点和高度的变化而变化。由气体扩散空间任意一点(x,y,0),得到污染源扩散气体的浓度。结合实际,在风力、湿度等天气条件下,合理考虑这些因素对蚌埠市PM2.5成因等规律的影响。
查阅资料可得,蚌埠市的共6个监测点(蚌埠学院、淮上区政府、百货大楼、工人疗养院、高新区、二水厂),监测搜集到每天4个不同时段(上午、中午、晚上、凌晨)的PM2.5日均含量分布数据。分别得到蚌埠PM2.5的时空分布和规律图,蚌埠市平均湿度、风力和PM2.5分别随时间变化规律图,见图1、图2。 通过蚌埠市PM2.5时空分布图可见,蚌埠市6个环境监测点PM2.5含量有基本一致的变化幅度和趋势,随着时间的推移变化(上午—中午—晚上—凌晨),蚌埠市PM2.5的时空分布呈现波动下降趋势,从上午至晚上期间,6个环境监测点的PM2.5浓度逐渐降低,至晚上是达到该日最低含量,随后空气中PM2.5浓度开始上升。其中,百货大楼、二水厂、高新区的PM2.5浓度总体较高,工人疗养院的PM2.5浓度变化范围最广,波动最高和最低浓度值也是最显著地,淮上区政府和蚌埠学院的两个监测点PM2.5浓度整体较低,每天的波动范围相对较小。结合《环境空气质量标准》,根据环境空气功能区质量要求得到环境空气污染基本项目浓度限值,可以推断出蚌埠市6个监测点24小时平均PM2.5浓度都属于二类区,均在35-75ug/m3内分布,满足二级空气质量要求。综合来看,时间和天气情况的变化也会对PM2.5浓度产生一定程度的影响,以此类推,季节变化也应是影响空气质量的重要因素,也就是说风力、湿度成为影响PM2.5含量的不可忽略因素。
在主要考虑风力和湿度的影响下,本文继续对蚌埠市的PM2.5浓度进行双因素分析。结合前面建立的多元线性回归模型,增加变量x5,x6(湿度,风力),利用MATLAB软件求解得到新的多元线性回归模型。得到 多元回歸曲线的拟合结果:b0=38.1092,b1=0.6498,b2=0.1842,b3=-0.8166,b4=-0.0307,b5=-0.1443,b6=-2.0151,R =0.9641,F=22.3930,p=0.0018。
可见,蚌埠市空气中PM2.5浓度与NO2、PM10浓度有正比关系,与空气中CO、SO2含量以及风力、湿度大小成反比,且风力对PM2.5的含量影响比湿度的影响大。因此,本文建立的多元线性回归模型符合统计学规律,综合最终的模型为:
y=38.1092+0.6498x1+0.1842x2-0.8166x3-0.0307x4-0.1443x5-2.0151x6
4 模型的检验
为了检验所建立的模型和运用方法的合理性与科学性,本文运用对比法,将实际检测出来的数据与模型计算出来的模拟值进行比较。得到以下是重新随机采取的多组实际数据,以及对应实际值与模拟值。由于篇幅限制本文仅给出4组随机实验数据,具体见表1。
通过与实际值进行比较发现,这四组数据的模拟值与实际值在一定程度上是高度拟合的,拟合精度分别为99%、94%、97%、99%,均保持在94%以上的准确率,具有较高的拟合精度,因此该模型是合理的。
5 模型的评价
(1)优点:利用相关数据软件对数据进行处理并作出各种平面图,使相关描述结果更加直观,更易于理解,运用MATLAB、SPSS等数学软件依据模型进行计算,提高工作效率。
(2)缺点:数据选取相对较少,代表性不够强烈,误差大,对于污染物的选取只选择了6项主要的污染因子,对于其他部分(季节因素等)的污染物采取了忽略处理,对最后的模型建立结果有一定的影响因素。在模型的建立中,我们的考虑并不全面,这样无疑会造成计算结果不准确。对于问题一,我们针对蚌埠市PM2.5的含量以及其他5个因素建立了多元线性回归模型,得出了PM2.5的含量与主要指标因素的线性关系,过程中我们并没有考虑到各指标因素之间的内部的相关影响,因此所得到的模型也不够精确,需要进一步改进。
参考文献
[1]张恒斌,杨敏,魏换其.空气中PM2.5问题的研究[J].广西师范学院学报:自然科学报,2014,31(4):97-99.
[2]李勇,宋慧,李玉珍,丁伟利.西安市空气PM2.5问题研究[J].黑龙江大学自然科学学报,2014,31(2):236-237.
[3]王玮,汤大钢,刘红杰.中国PM2.5污染状况和污染特征的研究[J].环境科学研究,2000,13(1): 1-5.