【摘 要】
:
随着配电网采集的数据规模日益增大,如何高效地预处理配电网数据成为目前配电网数据分析面临的重要问题之一。考虑到配电网大数据的复杂性,提出了基于Apache Spark的大规模数
【机 构】
:
国网河北省电力有限公司经济技术研究院,国网河北省电力有限公司
【基金项目】
:
国家自然科学基金资助项目(51877084)
论文部分内容阅读
随着配电网采集的数据规模日益增大,如何高效地预处理配电网数据成为目前配电网数据分析面临的重要问题之一。考虑到配电网大数据的复杂性,提出了基于Apache Spark的大规模数据并行预处理的方法。首先,为了更有效地处理配电网大数据,以Spark为计算引擎搭建了大数据并行计算平台;接着,分析了目前配电网大数据面临的一些普遍性问题,提出了针对这些问题的数据治理方案;然后,结合Spark计算引擎,介绍了配电网大数据预处理的具体流程;最后通过实验验证了数据预处理对配电网数据预测的精确度提升,以及分布式计算平台在数据
其他文献
日常工作中,由于对分析煤样和存查煤样的允许差没有明确规定,给煤质管理带来诸多不便.最近,我们运用数理统计方法,对一次技术比武的数据,进行了允许差探讨.结果发现,可以采用
【正】 当今世界各发达国家都十分重视教育事业及其教师队伍的发展,尤其在科学技术高度发达的美国,有着一套较为先进的师资管理方法。本文对美国高等学校教师队伍的结构,教师
目的:探讨并研究血清乳酸脱氢酶(LDH)与β2-微球蛋白(β_(2)-MG)联合检测在多发性骨髓瘤患者病情诊断及疗效和预后评估中的应用价值。方法:选取南通市肿瘤医院收治的40例多发
为有效管理高峰时段的空调负荷,配合政府部门做好电力需求侧管理工作提供理论依据。本文对2018年—2019年武汉市电网空调负荷与气温关系进行了全面的分析,利用回归分析方法进
目的:探讨使用胃镜活检技术诊断早期胃癌的准确率。方法:选取2019年4月至2020年3月期间武警四川总队医院收治的69例早期胃癌患者作为研究对象。为这些患者均使用胃镜活检技术
【正】淋巴管瘤(Lymphangiona)是由增生的淋巴管所构成的.多数是淋巴管的畸形或发育障碍,而不是真正的肿瘤.多见于儿童,发生部位多在四肢,头颈部及躯干.鼻腔内生长淋巴管瘤少
目前蒙古语语义Web方面的研究成果都是基于单机环境的,当语义Web信息检索系统投入实际运行时,单机环境存在存储容量有限和多用户并发查询速度慢等问题。针对此问题,提出了基
辛弃疾是南宋著名爱国词人,也是豪放词的继承者和发展者。词体在他手中,于内容与形式方面都达到了一个新的高度。辛词一改传统词风,展现出刚健雄豪的艺术风格,同时又不失词体所独