基于大数据技术的EAST实验数据访问日志分析系统

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:woshiwangxincheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国自主研发的EAST(全超导托卡马克)装置实验不断地开展,产生的实验数据的总量日益增加。实验数据大部分都放在MDSplus中,目前MDSplus的数据总量已经达到PB级。为了方便实验人员对MDSplus服务器上的用户行为和实验数据进行规范管理,因此对MDSplus实验数据有效地监控是很有必要的。需要在现有的MDSplus服务器的基础上设计一个MDSplus实验数据访问日志分析系统,该系统主要包括日志完善模块,离线处理模块,实时处理模块,监控数据展示等模块。现有的MDSplus对数据的管理并不包含完善的日志信息。因此系统需要对MDSplus日志模块进行完善,对用户和数据的访问信息进行实时地记录,同时日志能够根据Logrotate机制按照时间进行切割转储。产生的大量日志信息需要及时地备份到云服务器上,并进行海量日志信息的离线计算,从而得到按照时间周期变化的用户行为和数据信息数据。离线的日志数据计算采用的是传统的大数据框架高可用的Hadoop技术。在实验过程中,单一的离线数据的计算不能提供及时的MDSplus服务器状态信息,包括但不限于服务器出入流量信息,据此信息可以进行判断服务器的负载情况,是否有异常访问。为此实时日志的分析也是必不可少的,现有的日志实时分析系统是基于Spark生态圈中的SparkStreaming实时数据计算模型。系统还使用了Flume、Kafka的日志监测、聚合、分发等关键性技术,使得MDSplus海量日志数据的处理能力变得可能,且能够在秒级别处理千万条未处理的MDSplus日志信息。整个EAST实验数据访问日志分析系统基于Linux环境下开发,并采用WEB前端技术进行监控信息展示。该系统已经能够在实验中使用,系统工作能够满足设计需求。
其他文献
摘要:随着我国城镇化的加速发展,城市机动车保有量急剧增长,机动车尾气污染物排放日益成为影响人们日常生活的主要问题之一。微观交通仿真模型作为衔接城市交通流运行评价与机
在目前工业领域,指针式仪表在实际生产中应用非常普遍。大多数应用场合都是采用人工读数的方式来采集指针式仪表的数据,但很多测量现场是高温、高压、高辐射等恶劣危险的环境
自万科掀起了房地产企业项目跟投制度的风潮后,"跟投制度"已然成为房地产企业一种分享、发展、管理机制。本文先阐述项目跟投的相关概述,然后对标杆企业项目跟投机制进行对比
以物流服务供应链为研究对象,研究集成商期初时期对服务能力批发量和期权预订量的决策、需求即将发生时期对期权执行量的决策以及需求确定时期对现货采购量的决策,构建在无采
目的评价左心室重建术(室壁瘤闭式折叠术)对左心室重构的影响.方法普通级杂种犬12只作为实验动物,用结扎冠状动脉的方法,建立左心室室壁瘤的实验动物模型,于术前及术后48~72
媒体融合的主流发展趋势已改变传媒业的人才需求,培养全媒体应用型人才成为地方高校广播电视学专业人才培养的新方向。本文将分析媒体融合背景下制约广播电视学专业人才培养
目的:探讨克林霉素用药的不良反应类型以及预防措施,为临床合理用药提供依据。方法:整理、分析、归纳国内外相关文献资料,在此基础上分析克林霉素的不良反应。结果:介绍了克
本文介绍了学科融合的内涵、动因及主要方式,认为学科融合是当前科学和学科成长与发展的重要形式,提出高等学校的学科建设应顺应学科融合的需要,为学科融合创造条件,促进学科融合
结合高层住宅工程实例探讨连通相邻单元楼梯的连廊的设置方式及平时的管理方式。