基于机器学习的空气质量预测方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wdyan297
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空气质量的优劣与人民的幸福指数和身体健康息息相关。然而,随着中国近几十年工业化快速发展和城镇迅速扩张,环境问题凸显。很多地区正遭受着严重的空气污染问题,数以百万计的呼吸系统疾病是由不良的空气质量引起的。因此,对空气质量的科学分析和准确预测,成为决策部门与相关人群提前采取防范措施、预防疾病的必要条件。大气污染物浓度是和时间及空间相关的序列,其不仅在序列内部存在时间关联,序列之间还存在一定的依赖关系。基于数理统计的机器学习方法应用到空气质量预测中需要进行复杂的特征工程,空气质量的准确预测还面临较大的挑战。得益于深度神经网络的发展,基于神经网络的方法应对多种非线性复杂任务都有很好的效果。然而深度学习方法应用于空气质量预测也有其局限性,其一,类似于卷积神经网络(CNN,Convolutional Neural Network)或循环神经网络(RNN,Recurrent Neural Network)的方法无法用一个模型适应输入或输出中不同的序列长度;其二,直接使用序列到序列(Seq2Seq,Sequence-to-Sequence)模型会出现预测性能随着预测时间推移出现衰退的问题。为了提升预测效果,在Seq2Seq模型框架基础上,本文提出新的空气质量预测方法,具体如下:第一,本文提出一种基于注意力机制的预测方法(AMAQP,Attention Mechanism based Air Quality Predictor),旨在提升Seq2Seq的预测效果。首先,AMAQP在解码阶段引入了注意力机制(Attention Mechanism)用于上下文向量的计算。注意力机制学习原始数据的权重分布策略并将所有的编码状态融入到上下文向量,进一步增强时间特征的表示能力。其次,针对编码器和解码器中RNN难以训练、容易产生梯度爆炸或梯度消失的问题,本文采用长短期记忆网络(LSTM)作为编码器和解码器的模块替代原始的RNN结构,以更好应对长时依赖问题。除此之外,还试验了不同损失函数对模型的影响,将三种不同的损失函数分别应用到模型的训练。实验表明,使用注意力机制能够提升空气质量预测的准确性,选用合适的损失函数使得AMAQP性能获得进一步提升。第二,本文提出MSAQP模型,旨在解决使用注意力机制的Seq2Seq训练速度较慢、预测性能随着预测时间推移出现衰退的问题。该模型使用自注意力机制和位置编码作为编码器和解码器,自注意力机制不再需要依赖于RNN就可以完成对序列的编码解码神经网络,这是区别于普通注意力机制的。自注意力机制自适应学习大气中多种影响因素间的相关性,可以一步到位获取全局信息。由于注意力机制的大量运算使得模型的训练时间变长,本文采用多步递归输出策略,一次预测多个时间步长,减小递归预测而产生的误差积累同时提升训练速度。实验证明,MSAQP的训练速度能够接近Seq2Seq。此外,自注意力机制能更充分利用序列信息,在预测时间变长的情况下没有出现明显的预测能力下降,在MAE、R_Squared评价指标上均优于SVM、LSTM、GRU等多种主流预测模型,从而对北京市未来24小时PM2.5浓度的预测实现了较高的准确性,为政府部门和市民出行提供数据支持。
其他文献
实践课程作为全日制硕士专业学位课程体系的重要组成部分,是全日制硕士专业学位教育实现人才培养目标所不可忽视的重要内容,更是培养应用型人才最直接有效的途径。本文以S大学为个案,采用问卷调查、访谈、观察和文本分析的方法,对全日制硕士专业学位实践课程建设现状进行了调查,分析了其影响因素,并提出了相应的优化策略。本文除绪论外主要有三部分组成。第一部分从目标、内容、实施和评价等四个方面分析了全日制硕士专业学位
在理论研究和司法实践中,行政协议识别一直是行政协议纠纷处理的起始点。行政协议识别的标准紧扣定义而生,而行政协议定义的确定又以公私法二分理论为基础。由于公私法二分理论立论不稳,且过于陈旧无法对新的法律关系进行界分,导致以其为理论基础的行政协议在定义上无法确定。由于行政协议的定义无法确定,无法同民事合同截然区分开来,所以逻辑上由定义而生的识别标准也无法确定,裁判者无法准确地实现行政协议识别。尽管在我国
元认知策略是一种教会学生如何学习、如何监控以及如何自我评价及调整的策略,在当前的教育教学中开展此方面的教学实践非常必要。本研究以新疆乌鲁木齐某附属中学高二年级学生为研究对象,随机选取两个理科班,分别设置为实践班与对照班,实践班在实施元认识策略教学前,两个班在元认知策略应用情况、教师的教学水平、学生生物学习兴趣、第一次月考成绩等方面均无显著差异;学习满意度所包括的六方面等级均值无差异。同时对所在学校
违章现象一直是航道通航安全的主要威胁。现如今除了通过陆地对货物进行运输,河运需求量也在逐步增加,违章现象日益严重,主要包括:船方通过对船舶本身的水尺进行更改,使得能
陆相油藏储层非均质性较强,不同成因砂体性质差异较大;在注水开发过程中,注入水一般情况下会沿高渗透区推进,使不同成因砂体内部剩余油分布更为复杂。详细研究不同砂体特征及
伴随国民经济的腾飞发展,人民的生活水平也在不断提高。人们对待食品的态度也逐渐从饱腹到追求更绿色健康的食品,食品安全问题日益凸显并成为民生密切关注的问题之一。明确食品中污染物种类及来源,建立准确有效的食品安全监测体系是保障食品质量安全的必要手段。高效液相色谱(HPLC)是食品安全分析中最常见的分析手段之一,但在实际分析中常会遇到食品中有机污染物含量低于仪器检出限、食品基质种类繁多等问题从而影响分析;
目的:夜磨牙(sleep bruxism,SB)是一种常见的副功能活动,具有较高的患病率。多年来,许多研究普遍支持基于自我报告和/或临床检查诊断的SB与颞下颌关节紊乱病(temporomandibular disorders,TMD)有关,大多未采用多导睡眠监测(polysomnography,PSG)确诊SB,证据水平低下。近年来,磁共振成像(magnetic resonance imaging
随着当代中国社会的高速发展和全民健身计划的提出,城市居民对于户外健身活动的热情空前高涨,住区户外健身空间作为居民最基本户外活动单元,其作用渐渐显现,目前城市住区户外健身空间由于经济、场地、管理等因素的制约,存在诸多亟待解决的问题。因此,针对如何科学、合理的设计出舒适、适用、高品质的城市住区户外健身空间的研究就显得颇为重要。本文将以西安地区的城市住区户外健身空间为研究对象,采用“背景探析-相关研究基
合理有效的成本管理是公司提高公司经济效益的关键环节之一,它不仅能规范成本费用项目,更好的控制开支,还能增强企业的市场竞争力,有助于公司制定长期发展目标,实现企业的可持续发展。作业成本法作为一种更为精细的成本核算方法,弥补了传统成本法带来的不足,在国外,制造业、保险业、金融业和服务业等行业已被广泛采用作业成本法,但国内企业应采用作业成本法使用不是很普遍,应用较多的是制造行业,在其他行业的应用它还处在
当前环境重金属污染形势严峻。矿山生态型东南景天是一种镉/锌超积累植物,能耐受高浓度重金属镉和锌的胁迫,而且还可以把根部吸收的大部分镉和锌转运并富集在植株的地上部,是