论文部分内容阅读
随着配电物联网的快速发展,海量异构数据不断地从生产、传输、消费端产生,这些数据具有更新速度快、质量差、价值密度低、时间序列性强的特点。如何从这些海量数据中提取高质量的有价值数据,减少数据冗余,需要有效的数据清洗融合方法。为此,提出了一种基于时间序列相似性度量的数据清理、融合方法,该方法利用近似符号聚集、欧式算法和调整相似度加权的相似序列完成数据清理,利用多元异构数据融合算法完成数据融合。选用1440点负荷数据进行实验,结果表明,该方法可以检测配电网异常数据、填充空缺数据、减少数据冗余、融合异构数据,处理后