基于Spark的电力系统日志数据的分析处理

来源 :东南大学 | 被引量 : 5次 | 上传用户:jay2048
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电力调度自动化系统规模的不断扩大,电力系统需要实时处理的日志数据急剧增加。受到磁盘性能的影响,数据未能及时处理,产生延迟而无法满足实时性的需求,必须借助内存的处理能力。近年来,随着云计算、大数据技术的迅猛发展,运用大数据技术从海量的实时日志数据中获取潜在有用的信息已经得到了各方面广泛的关注。Spark就是其中脱颖而出的开源计算框架,Spark Streaming作为其上层工具,提供基于间隔的实时处理功能,能够满足调度自动化系统对某个时间段内实时数据的处理需求。然而受到数据流接收速率以及其他操作环境变化的影响,静态的批间隔以及块间隔将会导致较高的端到端延迟和处理时间,甚至引起系统的不稳定。本文针对SparkStreaming存在的问题,对其间隔的影响进行了深入的研究。本文深入分析了 SparkStreaming的处理流程,结合当前电力调度自动化系统日志数据流的特点,通过日志数据记录和字段的过滤,减少系统预处理的时间。针对批间隔对单查询任务端到端延迟的影响,提出了基于定点迭代的动态调整算法,快速收敛到最优的批间隔,减小单查询任务端到端的延迟。考虑到块间隔和运算相关性对多查询任务处理时间的影响,提出基于贪心算法的块间隔动态调整策略和基于相关性的合并算法,减少多查询任务的处理时间。对于实时计算所得的日志数据,给出了基于分布式数据库HBase日志数据存储的RowKey格式和表结构设计,并优化HBase的读写性能,为后续的查询分析提供支持。本文在现有Spark Streaming基础上,改进并开发了 DASpark Streaming系统,实现上述功能,并搭建实验平台。通过某一地级调度中心存储的实时日志数据,与现有的Spark Streaming进行了性能对比。实验结果表明,改进后的DASpark Streaming系统能够有效降低系统端到端的延迟和处理时间,提高了资源利用率,具有明显的优势。
其他文献
中华民族自古视鹿为吉祥物。传说中瑞兽麒麟,就是麋鹿的化身。福禄寿喜,这个“禄”字,音义都来自“鹿”。汉字中含“鹿”的字,多有美好吉祥之意。李延声先生喜爱鹿,擅画鹿。
期刊
“哈密”名称之原形为,是10世纪以前由维吾尔人命名的.后由演变为现今的。该名并不是哈密之古称昆莫或伊吾卢的变音。
期刊
隔膜是双电层电容器和混合型电池-超级电容器等电化学储能器件的重要组成元件.本文采用1 mol?L-1四乙基四氟硼酸铵的丙烯碳酸酯电解液制备了基于活性炭的扣式双电层电容器,并采
本周深港通市场上,3月2日-8日,据Wind数据显示,截至A股3月8日收市,深股通已用额度4.77亿元,当日剩余额度125.23亿元,占比96.33%。截至收盘,港股通已用额度4.22亿元,当日剩余
本文认为,骆宾王西行,只是经甘肃而到青海,未曾到过哈密和巴里坤。
目的了解我院机会性筛查的女性患者高危型人乳头瘤状病毒(high-risk human papilloma virus,HR-HPV)的感染情况,分析不同宫颈病变患者术后HR-HPV的转归、复发及其影响因素,并
传统太阳能电池正电极一般使用主要成分为金属银的导电浆料制成。金属银虽然抗氧化性能好,电学性能优异,但是其高昂的价格增加了太阳能电池的成本,限制了其进一步的应用。相对而言,金属铜价格便宜,电学性质良好,具有作为低成本导电材料的潜力,但是其氧化稳定性差,容易被氧化失去导电性,因此无法直接成为导电浆料的导电相填料。本文中利用在铜外包覆银的方法,形成银铜包覆结构的导电颗粒,在增加氧化稳定性的同时,成功地降
【正】 近年来,新疆逐步扩大了对西部邻国的经济交流,给新疆的现代化事业带来了积极的影响,并预示出了广阔的前景。从这里可以得到一个深刻的启示,这就是从新疆实际出发,创造
中美贸易关系缓和,美国财长姆努钦表示,将于明年1月与内地重启贸易谈判,但有关消息对股市刺激有限。联储局本周加息0.25厘,并暗示明年将再加息两次,资金仍然倾向流入美债避险
随社会和科学技术的高速发展,电梯已然成为人们生活中必不可少的垂直交通工具,目前全国电梯保有量已经突破600万台,并且仍保持着较高的增长速度,曳引式电梯则占据全国电梯保有量的90%以上,是使用最为广泛的电梯类型。平衡系数是曳引式电梯的重要技术参数,它的变化会引起电动机功率、曳引能力、钢丝绳在绳槽内的比压以及曳引系统的总质量等参数的变化,影响电梯整体的安全性能,并且由于电梯平衡系数过小引起的事故也是屡