基于社交网络传感器的雾霾预警系统

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:morningwind2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国工业的飞速发展,消耗了巨额环境资源,工业废水、废气、固废等排放使得环境污染问题与日俱增。传统的发现污染问题的方式,例如群众举报、物理仪器监测等已经无法处理日益增多的环境问题,需要覆盖范围更广、组建成本更低的环境监测数据。社交网络,作为公众表达民意的重要渠道,提高了公民参与政治经济生活讨论的积极性和网络问政的便捷性,已经成为人们进行舆论监督的重要平台。因此,社交网络的发展及其环境大数据的支持为我们监测环境状况提供了一个新的突破口。本文基于社交网络中目标事件的检测机制,采用微博用户作为“社交网络传感器”,针对实时微博数据流进行文本处理及分类,筛选出有效反映空气质量状况的“雾霾”信号,实现了计算“雾霾”发生概率的预测模型以及空气质量指数(AQI)的趋势预测模型。本文的工作主要包括以下几个方面:1.获取目标事件“雾霾”相关微博语料。以“雾霾”为关键词进行全网微博搜索,设计针对于微博站点页面信息结构的分布式爬虫,对搜索结果相关微博进行抽取并存储,爬取内容包括用户名、微博文本内容、微博发布时间、发布终端、发布地点等。2.针对爬虫抓取数据和空气质量指数(AQI)之间的关系,本文创造性地提出了“雾霾”指示器自动分类方法和基于“微博活跃指数”的“雾霾”预警模型。实验结果表明,本文提出的方法可以利用贝叶斯分类器自动分类“雾霾”相关微博,有效地识别出“雾霾”信号,雾霾预警模型可以全方位地考虑微博平台活跃度的影响,并在一定程度上避免平台“睡眠期”对预测结果的影响。3.为了解决微博数据的信息单一、表达缺乏标准的问题,本文应用了一种根据文本数据库中的关系识别对事件三元组重新建模的事件Embedding网络,其可以将高维稀疏的词Embedding向量转化成一个低维稠密的事件向量,并基于此实现卷积神经网络(CNN)的AQI趋势预测问题。实验结果表明,相比单纯使用词Embedding作为文本的特征,事件Embedding可以刻画出文本中的实体及关系。除此之外,与普通的前馈神经网络(NN)相比,基于CNN的预测模型可以提取出最具代表性的全局和局部特征,建立微博事件与AQI变化趋势之间的联系,从而使预测结果更加准确。
其他文献
司法实践中环境污染纠纷案件的责任主体往往难以独立承担判决结果带来的高额环境侵权赔偿金、环境修复金等,我国环境司法的发展必须在保护环境与维持企业发展之间找到平衡。
随着互联网技术的发展,由信息技术创造的网络空间俨然已成为人类生存的第五空间。代码犹如网络空间的法律,根植于硬件与软件之中,塑造着网络空间的架构,规范着网络用户的行为
mTOR信号通路在调控细胞生长增殖和代谢方面具有着重要的作用[1]。根据对免疫抑制药物雷帕酶素敏感性的高低可分为mTORC1和mTORC2信号通路,分别对应于mTORC1和mTORC2两类复合
云计算将远程数据中心的软硬件资源虚拟化后整合成可配置资源的共享池,以服务的形式提供给用户,用户按需使用共享池中的资源,将数据存储到云端。然而,云服务提供商和用户设备
神话是人类童年时期的产物,充满着神奇的想象和动人的情节。小学阶段的儿童具有着丰富的想象力、细致的观察力,总是难以分清现实和想象,对生活中不明白的现象也总是倾向于靠
CTCF和与之结合的cohesin蛋白复合物在绝缘子功能和哺乳动物基因组染色质高级结构的组织中发挥着极其重要的作用。最近的研究发现CTCF结合位点(CBSs)的方向与染色质的相互作
随着集成电路等半导体制作工艺的迅速发展,微处理器等芯片的尺寸越来越小,性能也随之增高,但是对电磁辐射等外界环境也越来越敏感。恶劣环境易引发嵌入式系统软硬件故障,可能
原钙粘蛋白(Protocadherin,Pcdh)基因簇可以选择性表达50多种蛋白,原钙粘蛋白质群在神经元多样性和单细胞特异性以及神经突触信号转导中发挥重要作用,但是目前Pcdh基因簇表达
在当前课程改革和高考改革的背景之下,在“以人为本”的教育理念推动之下,叩问教育初心,回归人本位成为教育教学的航向。历史作为一门综合性和趣味性都很强的课程,给我们呈现
现代化的政府是服务型的政府,它要求行政人员加速转变行政办公理念,从管理者转变为服务者,对于政府绩效评估内容来说,也从考核行政办公效率向考核公共服务情况转变。作为黑龙