基于COVID-19可视化数据管理系统设计

来源 :科学与生活 | 被引量 : 0次 | 上传用户:simon746cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:2020年初,新冠肺炎大爆发,各地防疫形式严峻,对新冠肺炎的趋势实时监控,对于疫情发展的态势,成为公众所迫切关心的话题。针对新冠疫情的实时数据汇总统计并以动态化形式展示数据信息设计一种可视化数据管理系统,通过对新冠肺炎数据进行可视分析,以直观的图表形式展示疫情动态变化趋势。针对新冠疫情数据进行数据采集、数据结构化、数据处理等设计一个可视化模型,以Heroku新冠疫情网站发布数据进行数据统计,形成每日新冠肺炎新增、死亡、治愈数量状态,并以地图的形式动态循环展现每日变化图,从而实现基于新冠疫情的可视化数据管理系统。
  关键词:可视化;数据管理;新冠肺炎;疫情监控
  0 引言
  2020年初,新型冠状病毒感染的肺炎(COVID-19)的爆发,引起了全世界的关注。疫情的实时动态数据也倍受公众关注,通过肺炎确诊数量、地区的变化来加强对地区的管控程度并作出及时调整至关重要。因此,基于COVID-19的可视化数据管理系统将成为一种解决方法。基于新冠病毒的实时动态的可视化数据管理系统将实现对新冠病毒数据的采集、结构化、存储、清洗、统计、最后展示。
  1 系统需求分析
  本系统的设计旨在开发一个可视化数据管理系统,针对数据模型定义,数据采集,数据处理,数据可视化均为可视化操作,实现对新冠肺炎病毒的采集与显示功能,并以地图的形式动态循环展现每日变化图。该系统主要根据Heroku发布的全球新冠肺炎数据进行实时采集,对采集数据进行清洗转换,再对整理好的数据进行统计,最后使用动态数据图进行展示。
  2 系统设计
  本系统共有4个模块,分别是:数据模型、数据采集、数据处理、数据可视化。每个模块对应不同的功能。功能模块设计图如下:
  2.1数据模型
  数据模型的实质是数据元素和实体的定义,可以理解为元数据管理,为新冠肺炎数据提供元数据定义,负责新冠肺炎数据数据的存取。
  在当下大数据时代,集群化的数据存储方案将会是理想的選择。
  本系统的在数据模型中本系统采用集成HDFS,HBase,MongoDB三大数据存储系统的方式,目的在于支持不同类型的数据存储,包括文件存储(HDFS)、结构化数据存储(HBase)、键值对存储(MongoDB)。HBase本身就运行在HDFS之上,使用列族数据库存储,对提高存储访问效率有所提高。
  数据采集的数据数据模型,首先应当区分国别(country),对于不同的国家还应该定义国家代码(country_code),其次是不同省市(province)。新冠病毒的确诊数据(confirmed)、死亡数据(deaths)、康复数据(recovered)是衡量新冠病毒动态的必要指标。如下图所示为新冠肺炎的数据模型定义:
  由于在后续过程中还会涉及统计的内容,因此对于统计的数据模型也应当预先定义完成。统计模型包括国别(country)、国家代码(country_code)、确诊数(confrimed)、死亡数(deaths)、康复数(recovered)。如下图所示为新冠肺炎汇总的数据模型定义:
  2.2数据采集
  数据采集又称为“数据获取”或“数据收集”。数据采集有多种多样的方式可以实现,例如文件解析采集、数据录入、数据库采集、网络爬虫等等。每种采集方式的针对性都非常强,对于不同的场景,采集方式的使用可能会有较大差异。
  2.2.1网络爬虫
  对于新冠肺炎数据的采集,本系统以采集公共互联网的网页信息的形式进行。网页采集的形式大多数都是基于网络爬虫。网络爬虫是按照一定规则,自动地不抓取互联网信息的一种程序或者脚本。网络爬虫工作时是从初始的地址开始,找到这些初始网页上链接到其他网页的地址列表,将它们存入待爬的地址表中,然后对地址表中的每个地址根据一定策略逐个搜索,从网页上下载、保存网页信息,分析并获取网页中符合条件的新的网页地址链接。
  基于网络爬虫的原理,我们可以自定义爬虫爬取的网页地址、爬取深度、爬取内容等。
  2.2.2数据源
  本系统以及模型所需数据来源于
  https://coronavirus-tracker-api.herokuapp.com/#/网站,通过网站可查询获取到全球新冠肺炎确诊总人数、死亡人数、康复人数、以及获取最新的已确诊病例,死亡和康复总数、还可通过地区获取数据等。
  网站给出了获取数据的路径,并且对返回的数据结构进行的解释,对于新冠肺炎数据的采集,采集获取到的数据均为Json数据格式。如图所示为数据返回样例和数据结构:
  对于上图所示数据结构,分为三个数据解析部分,一为确诊(confirmed),二为死亡(deaths),三为康复(recovered)。针对三类数据进行解析,可得到一个对象数组,对于每一个对象,其键值对指明了对应数据字段含义以及数据。如下图为对象数据内容:
  2.2.3数据采集
  本系统的数据采集脚本采用javascript的Nashorn引擎,这样做使调试更加方便、快速。
  为了保证数据的时效性,本系统定义了数据采集周期(定时器组件)、网络爬虫源(数据源组件)、数据解析脚本(js脚本)、以及数据存储位置(数据源组件)等四部分。
  1)定时器,设置采集任务启动方式,可以设置定时(02:00)启动,或间隔周期启动(3600秒)。
  2)数据源:网站,设置数据源网站信息,数据接口链接。
  3)网络爬虫,设置爬虫属性,结果输出变量。
  4)JS脚本,解析爬取的数据,结构化,预处理。
  5)目的表,设置数据存储的目的表信息。
  如图6所示为数据采集的流程设计图:
其他文献
摘要:企业上下需要积极完善劳动定额管理体系,并且以此为基础逐步加强管理的细化,使企业的现代化管理水平提升,这样才能保证企业具有更强的市场竞争力。  关键词:劳动定额;提升水平;现代化管理  1劳动定额概述  在企业的日常事务管理中,劳动定额占据非常重要的位置,可以使企业处于长期稳定的状态,所以企业需要逐步加强劳动定额管理,以标准化现代化的劳动定额管理方式为基础,逐步对劳动内容进行细化,明确劳动定额
期刊
摘要:近年来,随着我国高职院校的不断发展,针对高校后勤的社会化改革也在不断深化。在对高职院校食堂进行社会化管理改革的初始阶段,高校管理者在改革过程中还存在思想观念与管理方法上的问题与不足,本文就高校食堂社会化管理中存在的问题作了分析,并根据具体的情况,作了一些对策设想,希望能为高职院校食堂社会化管理,提供一些参考价值。  关键词:高职院校食堂;食堂社会化管理;;食堂管理问题策略  随着近年来我国高
期刊
摘要:本论文运用对比的手法,即以L公司的电子招投标业务与传统的招投标操作进行对比,阐述了L公司电子招投标业务依托互联网的特点在实施中的应用优势以及管理创新的体现。  关键词:电子招投标、管理创新一,公司简介  L公司是一家业务领域涉及电厂总承包、电厂环保大气处理、电厂设计、清洁能源、分布式能源等的电力工程公司。业务类型中总包、BOT型式占绝大多数。公司的分包采购在电力行业领域关注度较高;公司的招投
期刊
摘要:在建筑工程项目中,边坡支护技术发挥着重要作用,是进行其它施工分项的基础。在实际工作过程中,工作人员应正确认识边坡支护,并对应用要点进行掌握,这样才能更好的开展作业,提升施工质量。要想在真正意义上保证施工安全,防止安全事故的出现,应利用边坡支护技术,加固边坡,进而提升边坡土体稳定性。相对而言,对边坡稳定性造成影响具有多种原因,当前建筑工程,经常利用的边坡技术主要以复合土钉支护技术和锚固支护技术
期刊
摘要:近些年来,我国的社会经济在高速运转,国民经济也逐年提升,在城市化进程不断加快发展的背景之下,土木工程的数量和规模在不断的扩大,在一定程度上对于土木工程的施工管理也提出了更高的要求。在土木工程的施工管理过程中,还面临一系列的困境,需要管理人员加强整个土木工程的管理水平,提高新材料、新工艺的应用,保证土木工程能够实现自身的可持续发展。因此,本文就来对土木工程施工管理面临的困境与应对进行简单的分析
期刊
摘要:经济时代的到来,让我国各行各业得到了高速的发展,尤其是化工行业。那么在实际的工业工程施工环节中关键环节为机电安装,而机电安装施工效果将会影响整个工业施工质量,因此可以说机电安装能够保障工业物得以顺畅使用。基于此情况,工业机电安装施工质量一定要符合建设者以及使用者的要求。为此本文就深度探究工业机电安装的重要性分析,本着工业机电设备安装施工问题点,提出相对应的施工质量控制对策,进而提高机电安装施
期刊
摘要:现阶段,在全球化、经济市场化背景下,我国越来越重视各个行业的标准化建设,其和我国经济的发展息息相关。最近几年,市场竞争日益激烈,企业为了获得持续、稳定发展,也積极将优秀的管理理论和经验引入,以促进自身管理水平提高。尤其是企业标准化体系建设,逐渐演变成企业中的主要管理方式。对此,本文主要阐述了企业标准体系概念和组成,分析了企业实施标准化体系建设的重要作用,对企业标准化建设中存在的问题进行了探讨
期刊
摘要:热再生沥青面层是指在沥青混合料设计时,按一定比例掺加RAP,使其满足规范要求的路面。RAP的掺加可以大大节省沥青和石料,对工程造价和节能环保具有重要的意义。本文基于某工程改建,通过研究不同RAP掺量对热再生混合料路用性能的影响,确定最佳RAP掺量,进而应用于该工程,取得了较好的成果。  关键词:热再生,RAP,路用性能  沥青路面随着使用年限的增长,在行车荷载和环境因素的相互长期作用下,会产
期刊
摘要:在混凝土施工过程中,裂缝成为最常见的问题,这种现象一旦出现对建筑物结构内部钢筋等材料产生腐蚀,降低混凝土材料的承载能力、耐久性及抗渗能力,影响建筑物外观、使用寿命,嚴重者将会威胁到人身安全。为此,企业为减少裂缝现象产生,采取必要的施工措施。本文章分析了混凝土裂缝产生的原因以及预防措施。  关键词:建筑;裂缝;混凝施工土;成因;预防措施  一、混凝土施工过程中出现裂缝的原因分析  1.产生温度
期刊
摘要:为了培养具有跨文化能力的创新创业人才,推进高校毕业生就业,欧盟推行了伊拉斯谟+项目,并在近些年进行了一系列改革。通过研究德国汉诺威应用科技大学实施这一项目的实际案例,分析此项目的分类、优势、选拔规则以及国际合作。最终目的是总结和借鉴其经验,提出适合中国高校的跨文化创新创业人才培养方案。  关键词:伊拉斯谟高教计划;跨文化能力;创新创业人才;培养方案  伊拉斯谟项目是欧盟于1987年推出的一项
期刊