论文部分内容阅读
近年来,空气污染现象以高频率出现在我们日常生活中,直接影响着人体身心健康和正常的生活出行,所以空气污染已变成亟待解决的问题。PM2.5作为引起空气污染的关键因素,逐渐成为人们关注的焦点。由于PM2.5浓度预测结果不仅能有效指导居民合理安排日常行为活动以避免危害人体健康,而且还能为政府相关部门及时制定有效的防控措施提供重要参考依据,因此对PM2.5浓度进行准确预测具有重要的现实意义和社会价值。本文的研究内容主要包括以下几点:1.针对与PM2.5浓度相关变量众多且变量间相互作用关系复杂问题,设计了基于散点图(Scatter Plot,SP)定性分析和偏互信息(Partial Mutual Information,PMI)定量计算的混合特征选择算法。首先采用散点图方法将各变量与PM2.5的相关程度进行可视化,并采用数学曲线进行拟合,通过所做散点图定性分析各变量与PM2.5之间的相关性,进而从原始多源特征集中选取出预选特征子集。其次利用PMI方法能同时考虑各变量与PM2.5间最大相关性和各变量间冗余性的优势,定量计算PM2.5与预选特征子集中各变量的偏互信息并基于TAIC值的变化情况对变量进行筛选,进而确定最优特征子集。最后引入其他方法与该特征选择方法进行实验比较,实验表明该方法能有效地进行特征选择。2.提出了一种基于混合评价指标(Hybrid Evaluation Index,HEI)的自组织模糊神经网络(Self-Organizing Fuzzy Neural Network Base on Hybrid Evaluation Index,HEI-SOFNN)。首先利用模糊C均值聚类(Fuzzy C-means Clustering,FCM)对网络结构初始化以解决因初始参数选取不当而引发陷入局部极小和收敛速度慢的问题。然后利用相关性评价指标(Relevance Evaluation Index,REI)判断模糊神经网络RBF层神经元之间的相关性,同时根据训练过程中网络输出均方根误差(Root Mean Square Error,RMSE)的变化情况来确定网络的学习能力,进而基于REI和RMSE提出了HEI。通过HEI来调整模糊神经网络的拓扑结构,实现了无需增长和修剪阈值模糊神经网络结构即可动态自调整的目标。同时,为了保证神经网络的收敛速度和精度,采用自适应梯度下降算法更新网络的非线性参数并用最小二乘法更新网络的线性参数。此外,给出了HEI-SOFNN网络的收敛性证明,以保证该网络的性能及可靠性。最后采用三个基准实验来验证所设计网络的有效性。3.设计了一种基于Bagging集成机制和HEI-SOFNN的集成自组织模糊神经网络(Ensemble Self-Organizing Fuzzy Neural Network Base on Hybrid Evaluation Index,EHEI-SOFNN)。首先利用自助采样法获取一些具有多样性的样本子集,从而保证各样本子集能训练出具有差异性的单个弱学习器,其次通过引入Bagging集成机制,并借助HEI-SOFNN在通过动态自调整方式生成最优网络结构以提高准确性的同时也能产生具有差异性网络结构的优势,进而基于Bagging集成机制与HEI-SOFNN设计一种集成自组织模糊神经网络EHEI-SOFNN。同时,给出了EHEI-SOFNN网络的收敛性证明,以保证该网络的性能及可靠性。最后采用三个基准实验来验证所设计网络的有效性。4.搭建了PM2.5浓度预测模型。首先以北京市为研究对象,采集该市的小时多源数据变量,其中包括图像数据、气象数据以及污染物浓度数据,并利用混合特征选择方法综合考量散点图定性分析与PMI定量计算结果,进而选取出具有12维特征的最优特征子集。其次将最优特征子集中12维变量用作集成自组织模糊神经网络EHEI-SOFNN的输入,以预测PM2.5小时浓度。最后通过与其他算法进行实验对比,结果表明所建立的PM2.5浓度预测模型是有效的,能准确预测PM2.5的小时浓度。5.开发了一款PM2.5智能预测APP。首先对待开发的PM2.5智能预测APP进行需求分析,其中确定为用户方便快捷的提供PM2.5预测浓度是主要功能。其次设计并完善了APP开发方案以及软件功能实现的技术路线。最后将MATLAB训练好的EHEI-SOFNN模型参数存入Apache服务器端,在Android Studio开发环境下使用Android语言进行用户端开发,进而推出了一款具有预测PM2.5小时浓度、查询天气状况与空气质量、推送生活建议等功能的智能预测APP。