论文部分内容阅读
随着智能电网的快速发展,电网设备状态监测数据呈指数级增长,逐渐构成电网设备状态监测大数据。传统计算架构已无法满足计算性能需求。结合Spark大数据处理技术和阿里云E-MapReduce云计算平台,提出电网设备状态监测大数据并行模式识别方法,旨在提升电网设备在线监测系统对短时间内骤增的报警监测数据快速批量分析的能力。设计了基于Spark的并行化k最近邻分类算法(k-Nearest Neighbor,KNN)Spark-KNN,实现了海量绝缘子泄漏电流数据的并行模式识别。实验结果表明,Spark-KNN