基于多源数据和集成自组织模糊神经网络的PM2.5浓度预测研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wgm740821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,空气污染现象以高频率出现在我们日常生活中,直接影响着人体身心健康和正常的生活出行,所以空气污染已变成亟待解决的问题。PM2.5作为引起空气污染的关键因素,逐渐成为人们关注的焦点。由于PM2.5浓度预测结果不仅能有效指导居民合理安排日常行为活动以避免危害人体健康,而且还能为政府相关部门及时制定有效的防控措施提供重要参考依据,因此对PM2.5浓度进行准确预测具有重要的现实意义和社会价值。本文的研究内容主要包括以下几点:1.针对与PM2.5浓度相关变量众多且变量间相互作用关系复杂问题,设计了基于散点图(Scatter Plot,SP)定性分析和偏互信息(Partial Mutual Information,PMI)定量计算的混合特征选择算法。首先采用散点图方法将各变量与PM2.5的相关程度进行可视化,并采用数学曲线进行拟合,通过所做散点图定性分析各变量与PM2.5之间的相关性,进而从原始多源特征集中选取出预选特征子集。其次利用PMI方法能同时考虑各变量与PM2.5间最大相关性和各变量间冗余性的优势,定量计算PM2.5与预选特征子集中各变量的偏互信息并基于TAIC值的变化情况对变量进行筛选,进而确定最优特征子集。最后引入其他方法与该特征选择方法进行实验比较,实验表明该方法能有效地进行特征选择。2.提出了一种基于混合评价指标(Hybrid Evaluation Index,HEI)的自组织模糊神经网络(Self-Organizing Fuzzy Neural Network Base on Hybrid Evaluation Index,HEI-SOFNN)。首先利用模糊C均值聚类(Fuzzy C-means Clustering,FCM)对网络结构初始化以解决因初始参数选取不当而引发陷入局部极小和收敛速度慢的问题。然后利用相关性评价指标(Relevance Evaluation Index,REI)判断模糊神经网络RBF层神经元之间的相关性,同时根据训练过程中网络输出均方根误差(Root Mean Square Error,RMSE)的变化情况来确定网络的学习能力,进而基于REI和RMSE提出了HEI。通过HEI来调整模糊神经网络的拓扑结构,实现了无需增长和修剪阈值模糊神经网络结构即可动态自调整的目标。同时,为了保证神经网络的收敛速度和精度,采用自适应梯度下降算法更新网络的非线性参数并用最小二乘法更新网络的线性参数。此外,给出了HEI-SOFNN网络的收敛性证明,以保证该网络的性能及可靠性。最后采用三个基准实验来验证所设计网络的有效性。3.设计了一种基于Bagging集成机制和HEI-SOFNN的集成自组织模糊神经网络(Ensemble Self-Organizing Fuzzy Neural Network Base on Hybrid Evaluation Index,EHEI-SOFNN)。首先利用自助采样法获取一些具有多样性的样本子集,从而保证各样本子集能训练出具有差异性的单个弱学习器,其次通过引入Bagging集成机制,并借助HEI-SOFNN在通过动态自调整方式生成最优网络结构以提高准确性的同时也能产生具有差异性网络结构的优势,进而基于Bagging集成机制与HEI-SOFNN设计一种集成自组织模糊神经网络EHEI-SOFNN。同时,给出了EHEI-SOFNN网络的收敛性证明,以保证该网络的性能及可靠性。最后采用三个基准实验来验证所设计网络的有效性。4.搭建了PM2.5浓度预测模型。首先以北京市为研究对象,采集该市的小时多源数据变量,其中包括图像数据、气象数据以及污染物浓度数据,并利用混合特征选择方法综合考量散点图定性分析与PMI定量计算结果,进而选取出具有12维特征的最优特征子集。其次将最优特征子集中12维变量用作集成自组织模糊神经网络EHEI-SOFNN的输入,以预测PM2.5小时浓度。最后通过与其他算法进行实验对比,结果表明所建立的PM2.5浓度预测模型是有效的,能准确预测PM2.5的小时浓度。5.开发了一款PM2.5智能预测APP。首先对待开发的PM2.5智能预测APP进行需求分析,其中确定为用户方便快捷的提供PM2.5预测浓度是主要功能。其次设计并完善了APP开发方案以及软件功能实现的技术路线。最后将MATLAB训练好的EHEI-SOFNN模型参数存入Apache服务器端,在Android Studio开发环境下使用Android语言进行用户端开发,进而推出了一款具有预测PM2.5小时浓度、查询天气状况与空气质量、推送生活建议等功能的智能预测APP。
其他文献
随着移动互联网时代的到来与人工智能技术的发展,如何快速有效地检索互联网上的海量数字图像资源,是一个十分重要且具有现实意义的研究课题。图像自动标注目的是学习并建立图像视觉特征与文本标签之间的映射关系,让计算机自动地为图像标注反映其语义内容的关键词,已广泛应用于图像检索、场景理解等领域,已成为计算机视觉领域的研究热点。本文在深度卷积神经网络的基础上,重点研究了迁移学习技术在计算机视觉领域的应用,并对图
作为安全等级为一级的构筑物,吸热塔具有重心高、荷载大、低阻尼的特点,故而其本身易产生较大附加弯矩,在地震作用下鞭梢效应明显,因此对此种结构的抗震性能研究十分重要。本文以摩洛哥的Noor III光热电站吸热塔为研究对象,根据SAP2000有限元软件模拟,对原型塔的地震响应规律进行了研究,并确定了该吸热塔的振动台缩尺模型简化设计方案,设计并制作了其1/20振动台试验模型,并进行了三向地震动输入振动台试
同声传译作为口译的一种方式,在国际科技文化交流中充当媒介,扮演重要角色。科技英语其自身具有特点与难点,因此译员需要在口译过程中防止困难造成的认知负荷。口译员如何在
电子器件的发热功率越来越大,若温度过高将影响电子器件的工作寿命和稳定性,因此研究电子元器件的散热问题具有重要的意义。石墨膜具有优异的物理化学性能,与散热材料轻量化、高导热、耐高温的发展趋势十分符合,可作为金属散热材料替代品,石墨膜散热材料已引起人们高度关注。但石墨膜力学强度差且Z轴方向导热系数低。本文在研究粘接剂材料配方组成及其薄膜半固化片制备工艺的基础上,采取热压成型技术制备多层石墨膜复合板,以
目的:对比分析腹腔热灌注化疗联合全身化疗治疗T4期结直肠癌的临床疗效及安全性。方法:本研究选择回顾性的研究方法。收集分析2016年4月至2018年4月期间于宜昌市中心人民医院施行结直肠根治术后接受全身化疗或腹腔热灌注化疗及全身化疗的100例T4结直肠癌患者临床资料及预后资料。其中,52例患者手术后接受腹腔热灌注化疗及常规全身化疗(HIPEC组),48例患者手术后仅接受常规全身化疗(对照组)。观察比
由于太阳能是资源丰富、绿色环保、安全友好的可再生能源,全世界范围内都将加大太阳能发电的渗透率,其具有迅猛的发展趋势和良好的发展前景。但是光伏发电功率出力受到气象、地球自转等因素的影响,具有间歇性、不稳定性和不确定性。与传统的火力发电相比,势必会给大规模光伏并网带来许多挑战。因此,提高光伏电站出力预测的精度对保证电力系统的安全、稳定运行和提高电能质量具有重要意义。本文结合基于天气类型的聚类分析和机器
牙隐裂,指从牙冠咬合面向根尖方向延伸的裂纹线,通常从牙齿中央窝向近远中边缘嵴方向延伸、可涉及一个或两个边缘嵴,但是牙齿没有完全分开成两部分。牙隐裂的临床诊治一直是口腔医师面临的一大挑战,因为裂纹的隐匿性导致诊断不易,更由于治疗前期难于制定可预期的治疗计划,以及远期预后具有不可预测性。牙隐裂的早期症状不明显,可引起冷刺激敏感和咬合不适,若未及时干预,裂纹会继续发展延伸至牙本质,甚至髓腔,引起牙髓炎或
抑郁情绪是指一系列以心境低落为主的负性情绪状态,它的发生往往会伴随诸多消极后效的出现。青少年阶段是抑郁情绪发展变化的关键时期,这种负性情绪体验是影响青少年身心健康的重要危险性因素之一,备受教育工作者和学生家长的关注。因此,关于青少年抑郁情绪的探讨具有重要的理论意义和深远的现实意义。家庭系统模式理论认为,家庭对青少年成长过程中心理行为的发展变化具有深远的影响,是影响青少年抑郁情绪的重要因素之一。根据
文字、偏旁同形現象是漢字在早期階段不完善的表現,也是古文字的重要特點之一。本文選取近年新出版的《清華大學藏戰國竹書》(一)-(五)為底本資料,查找出其中的同形字組和同
电力供应公司在满足预计的能源需求、环境问题、安全性、可靠性和可再生能源一体化方面面临着重大挑战。目前,大多数电网都是基于数十年历史的分级集中式基础设施。电力行业