基于Spark的电网大数据统计中等值连接问题的优化及其应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户：leki55

【摘要】

：

随着互联网技术飞速发展,在电子商务、科学研究、社交平台等诸多领域,数据规模、数据种类正在极速增长,大数据的时代已然来临。在电网领域,随着物联网的发展,传感器的大量应

【作者】

：

皮兴杰

【出处】

：

重庆大学

【发表日期】

：

2016年期

【关键词】

：

Spark Spark SQL 等值连接电网大数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术飞速发展,在电子商务、科学研究、社交平台等诸多领域,数据规模、数据种类正在极速增长,大数据的时代已然来临。在电网领域,随着物联网的发展,传感器的大量应用,监控采集到的数据也越来越庞大。由于数据规模大,数据类型多,数据处理时效性高,传统的数据处理技术无法满足技术要求。针对电网大数据的统计分析,急需大数据技术的支持。Spark是一个新兴、高效的大数据计算框架,它提供有丰富的组件及API,支持流式数据的处理、图计算、机器学习及SQL查询。在电网大数据的统计分析中,涉及大表之间的关联操作。Spark中采用join操作对两表进行关联,关联过程中会有大量不符合条件的数据与Shuffle操作,导致join的效率不高。本文针对Spark中join操作的低效问题和电网大数据统计分析的实际应用问题,首先,提出一种基于BloomFilter过滤再分区的算法,通过这种方式预先过滤掉大部分不符合条件的连接数据,然后针对数据倾斜的问题进行再分区,充分发挥各节点的计算资源,最大程序上优化join过程,从而提高程序的整体效率。最后,本文在国家电网重庆供电公司调控中心的统计业务需求背景下,结合Spark及Spark SQL提出了一个电网数据处理模型,通过与J2EE Web技术整合,实现了电网数据的采集、计算分析和展示。

其他文献

蜂群的春季管理

<正> 蜂群的春季管理,一般在立春节气过后便可开始。一.检查蜂群。在检查中调整蜂路,提出余脾,达到蜂脾相称;查出蜂王是否健在,巢内是否潮湿;还应查出群势的强弱和饲料的多

期刊

蜂群春季管理保温青繁病虫害卵圈强弱群互相抽补

浅析在非公有制经济组织中如何加强党建工作

<正> 近几年来,黎平县非公有制经济迅猛发展,有力地促进了全县经济社会的发展。当前,如何加强对这一新领域的党建工作,是各级党组织面临的又一项新任务、新课题。前不久,我们

期刊

非公有制经济组织中国共产党党的建设个体私营企业

甲状腺手术中喉返神经保护60例分析

目的：分析60例甲状腺手术患者采用喉返神经保护措施的临床手术效果,并探讨该措施的必要性和方式。方法：回顾性分析2007年4月～2009年4月在我院进行甲状腺手术治疗的60例患者的临

期刊

甲状腺手术喉返神经显露保护

基于中学物理实验活动的STEM教育实践

美国早已开始STEM教育的探索,取得一定的成效后各国开始学习、模仿,中国也是其中之一。2015年教育部《关于“十三五”期间全面推进教育信息化工作的指导意见(征求意见稿)》的

学位

STEM教育物理实验实验活动课程整合

家蚕真菌病的发生与防治

期刊

家蚕真菌病防治病因真菌孢子防僵粉

怎样加工营养草喂羊

<正> 一、粉碎将阴干或晒干的秸秆粉碎成长10毫米、宽1～3毫米的草粉。各种原料需单独粉碎,即禾本科植物与豆科植物分别粉碎。二、发酵将粉碎好的禾本科草粉和豆科草粉按3:1

期刊

羊饲料加工营养草发酵粉碎

建组织抓培训重启用——江口县上千乡土人才成为农村致富“领头雁”

期刊

江口县人才培训农业农村致富

农村普通初中“分流”教学初探

<正> 随着社会主义市场经济的建立和发展,给我国各行各业带来了新的生机。教育这个古老的话题,在新形势下又添了许多新意,特别是农村教育综合改革更是沸沸扬扬,乡镇普通初中

期刊

教育综合改革初中教育教学尝试教学计划重点班学有所得兴趣小组教风阶段学习接触社会

四君子汤灌肠治疗新生儿窒息后喂养不耐受及其血清一氧化氮动态变化

目的：探讨四君子汤保留灌肠治疗新生儿窒息后喂养不耐受的临床疗效及其对血清一氧化氮的影响。方法：将我院收治的窒息后喂养不耐受的52例患儿随机分为对照组和治疗组,每组各26

期刊

新生儿窒息喂养不耐受四君子汤一氧化氮

桂花苗的五种繁殖方法

期刊

扦插法桂花苗木繁殖嫁接法

基于Spark的电网大数据统计中等值连接问题的优化及其应用

与本文相关的学术论文