水电企业大数据基础平台的设计与实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:lzflivecn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着水电企业信息化的不断发展,企业已经累积了大量的结构化数据和非结构化数据,同时还存在潜在的可采集的海量实时数据。现今,数据已是企业的无形资产,企业对于利用数据驱动发展的需求十分迫切。当前水电企业在建设数据中心时基本采用传统架构,存在扩展性差、建设成本高、运行成本高,支持数据类型单一、数据处理效率低下等问题。无法满足大数据时代下高速增长的全类型数据存储和处理需求,不能支撑大数据时代下水电企业深度利用潜在数据资产的需求。本文针对目前的问题,梳理了水电企业的信息数据资源,完成了水电企业大数据基础平台的需求分析,完成了混合架构的大数据基础平台的设计和实现。大数据基础平台主包括两个数据集成层和数据存储层。大数据基础平台的数据集成层针对水电企业各信息系统、自动化系统中的结构化数据、非结构化数据和实时数据三种类型的数据集成需求,从数据场景、技术方式、数据特征、触发机制、处理步骤等维度总结,数据集成层通过接口表、接口数据文件、接口调用、消息队列等方式,实现数据的自动收集、整理、清洗、转换,并存储到平台的数据存储层。大数据基础平台的数据存储层包含数据仓库平台,分布式数据平台,流数据平台。基于国产数据库搭建Gbase 8T数据仓库平台,数据仓库进行了分区设计,分为缓冲区、整合区、汇总区和集市区,通过ETL技术在数据仓库内对数据实现整合、汇总,实现结构化数据按照业务主题域进行分类和存储。基于Hadoop搭建分布式数据平台,文件格式采用HDFS分布式文件系统,数据库采用HBase分布式列式数据库,满足海量数据存储和并发需求。分布式数据平台进行了分区设计,分为非结构化数据区,流数据转储区。非结构化数据区实现了非结构化数据的存储,并与结构化数据建立了关联。流数据转储区实现了海量实时消息数据的持久化存储。基于“Kafka+Storm+Redis”搭建流数据平台,针对数据源层中的各种实时消息进行,实现高效的,可靠的,实时的流式处理并存储。大数据基础平台实现流域全类型数据的集中存储和整合,具备高数据处理能力,解决了企业内部各信息系统的数据孤岛情况,为后续挖掘数据价值,实现数据驱动企业打下基础。
其他文献
为了解实际使用浓度消毒灵的有效时限 ,动态观察了消毒灵使用和贮存过程中的杀菌率及有效氯含量变化。 1∶40 0稀释有效氯含量为 14.0 5 %的消毒灵 ,在平均气温 2 8.5℃ ,相
脑卒中是临床上最常见的脑血管疾病。临床研究发现,脑卒中患者若能在发病之前发现此病并进行预防性的治疗,可将此病的发病率降低90%以上。那么,脑卒中患者如何在发病前发现此
近日,英国科学家通过研究发现,多吃橙子及其他柑橘类水果能降低中风的发病率。
目的:探讨输卵管双氧水造影对不孕症诊断和治疗的价值.方法:对94例不孕症妇女行输卵管双氧水造影,观察输卵管通畅程度.结果:输卵管通畅情况,双侧通畅34例、一侧通畅一侧欠通畅12
慢性肾炎即慢性肾小球肾炎的简称。是由多种原发性肾小球疾病导致的一组病程迁延,以蛋白尿为主,或兼水肿、高血压、血尿为临床表现的疾病,终至渐进性慢性肾功能不全。按其主要临床表现,多属祖国医学“水肿”、“眩晕”、“虚劳”、“腰痛”之范畴。以中药为主治疗慢性肾炎患者53例,取得了较好的效果。现报告如下。   资料与方法   2008年1月~2010年4月收治慢性肾炎患者53例,男35例,女18例;年龄20
我今年55岁,患冠心病已经5年了。虽然长期服用硝酸异山梨酯、冠心苏合丸等药物进行治疗,但我仍经常出现胸闷、胸部和左后背压榨性疼痛等症状,在劳累时这些症状还会加重。有人告
<正>2017年3月30日,美国政府问责局(GAO)发布了新版《国防部重大武器项目评估》年度报告(下称《评估报告》)。该系列报告始于2003年,每年发布一版,目的是评估国防部重大武器
脑卒中是严重威胁我国居民健康的疾病之一。不过,受传统观念的影响,很多人对脑卒中知之甚少,甚至对脑卒中还有一些错误的认识,这种情况给脑卒中的防治增加了难度。那么,人们
临床研究发现,脑卒中(尤其是出血性脑卒中)患者在发病后,若能及时正确地进行抢救,可有效地减少其发生肢体运动障碍、语言障碍、瘫痪等严重后遗症的几率。那么,当你的身边突然有
急性缺血性脑卒中(主要是指血栓性脑梗塞、栓塞性脑梗塞和腔隙性脑梗塞)是致死率和致残率都很高的脑血管疾病。研究发现,此病患者在发病后,应首选溶栓治疗。这是因为大多数的缺血