面向电网大数据的数据挖掘平台子系统的设计与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:daihaolr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随智能电网技术的快速发展,智能电网在发电、配电、用电等多个重要环节已经产生了海量数据并持续快速增长,这些数据囊括了大量的信息流、电力流以及业务流等信息。海量的电网数据中蕴含了大量的用户用电行为及配电网运行状况等潜在信息。然而简单的数理统计,难以对海量电网数据进行处理,并充分发现电网数据中蕴含的知识。因此,智能电网与数据挖掘技术的融合已经成为必然的发展趋势。合理的运用电网数据挖掘进行科学研究及应用推广,无论是对电力部门进行有效的网架结构优化、电力资源配置,还是提高电力用户的体验,都有十分重要的意义。为了解决在电网数据挖掘研究过程中缺乏数据挖掘平台系统进行支持的问题,本文设计并实现了面向电网大数据的数据挖掘平台子系统。该系统是基于HDFS和Spark分布式集群的B/S架构Web平台。通过该系统可以快速地实现对海量电网数据进行聚类、分类、关联分析等数据挖掘计算。同时,也可以通过集成的电网数据挖掘场景计算方便快速地进行电网知识发现。本文首先根据电网数据挖掘研究现状和大数据平台发展现状,提出了电网数据挖掘平台在功能上和非功能上的需求;根据需求,对系统的总体架构、数据存储、相关接口、工作流程和部署视图进行设计;本文还设计并实现了远程调用Spark的可编程解决方案,使开发者可以在Web框架中对分布式数据集采用面向对象的方法编程;然后,本文对系统的核心模块电网场景模块进行详细设计,说明了系统对电网场景的集成和运行方式。同时基于某市2015年配电网遥控记录,设计了配电网遥控结果预测场景,通过对随机森林算法进行改进有效提高模型质量,经实验证明模型的预测结果可以有效地为调度员提供参考;最后,通过单元测试、集成测试以及性能测试验证本系统可为电网大数据研究提供有效的数据挖掘平台。
其他文献
四川盆地红层分布广泛,其特殊的工程特性常导致严重的地质灾害。通过分析成仁高速文宫连接线边坡的变形破坏特征,得出边坡在开挖和降雨的影响下破坏机制为蠕滑—拉裂。进一步用
江恩有句著名论断,叫做“历史会重演”。江恩又说,过去发生过的,现在会发生,将来仍然还会发生,没有新的东西(大意)。 在我看来,江恩此理论之根源在于,股市有命,构成生命的基
重庆地区上二叠统包括龙潭组/吴家坪组和长兴组,主要发育海陆过渡相(海湾-泻湖-潮坪)及浅海碳酸盐沉积,其中龙潭组和吴家坪组为同期异相沉积。通过对区内钻井剖面及露头剖面的
在连续政策利好的刺激下,本周大盘经历了从大悲到大喜并连续上扬的“9·15”井喷,四个交易日逼空快速上扬155点。极度压抑达5个多月的作多热情一朝释放,个股连续出现大面
晋煤集团赵庄矿3 号煤层为高瓦斯煤层,瓦斯抽采难度大,存在煤与瓦斯突出的安全隐患,防治水方面还存在底板带压开采问题,严重制约了矿井安全高效生产.通过提出保护层开采方案,
研制异型桩是降低负摩阻力的重要措施之一,对目前能降低负摩阻力的异型桩的种类和特征进行了系统分析与总结,并介绍了作者已授权的一项国家发明专利-种端部螺纹X 形变截面预
<正> 处方:硫黄50g己烯雌酚1g氯霉素20g地塞米松0.25g5%新洁尔灭20ml外用香精适量霜剂基质加至1,000g制法:取硫黄、氯霉素、己烯雌酚过120目筛,
预测煤层气井的压裂难易程度是制定煤层气井压裂方案的关键问题。目前,国内外还没有形成完善的压裂预测方法。以韩城区块煤层气井的压裂为例,通过测井资料和现场压裂数据,利用SP
<正>互联网技术进入中国已有30年,且与中国信息化建设并行至今。随着移动互联网、大数据、云计算、人工智能等新技术不断涌现,人们生活越来越便利,企业管理变得简单且智慧。
正像11月17日的大限之战把中国足协逼到了墙角,让任何苟延残喘的幻想都彻底地覆灭了一样,王小石的及时出现揭开了中国证监会的盖子,王小石案应该成为中国证券史上的一个标志