论文部分内容阅读
在21世纪物联网飞速发展的背景下,供热系统的智能化发展为管网运行和控制调节提供了许多便利,配套的信息采集和传输系统成就了集中供热“大数据”时代,合理的数据挖掘将为减少供热能源消耗和保障管网运行安全等目标开辟新的探索道路。然而大数据的出现使得数据质量问题也日益突出,供热数据中包含的错误数据对深入的挖掘分析造成诸多干扰,因此在供热领域数据校正技术的引入是十分必要的。本文首先将数据校正的焦点确定在异常数据的处理问题上,并且提出了异常检测、异常分类、异常替换的数据校正三步法,借助孤立森林算法和BP神经网络的计算原理构建数据校正框架内核。在实际供热数据样本缺失和运行反馈不全的现状下,本文中应用理论模型的仿真数据集为数据校正的研究完善数据基础。首先介绍了供热空间管网水力计算模型及MKP求解方法,通过空间算例管网模型构建和仿真非正常运行工况,分析管段流量与节点压力的变化规律,并以参数变化率构建非正常运行工况仿真数据集。另外基于所有结果人工构建一个分阶段改变流量的算例管网运行数据样本集,并且在其中随机插入不同模式的异常数据记录,同时也添加了随机误差,使构造的样本集中数据模式更丰富,满足问题研究需求。然后在人工构造的供热管网数据样本集上实现了数据校正方法的验证,第一步基于孤立森林算法建立了异常检测模型,在样本集上表现出良好的异常检测性能,检测正确率达到93%,ROC曲线接近左上角且AUC值高达0.987。此外通过参数分析可知较小规模采样对于模型的检测性能影响不大。第二步基于BP神经网络建立异常分类模型,以非正常运行工况仿真数据集为训练样本,模型通过对不同数据模型的学习区分过程异常和测量异常,经测试模型分类准确率能够达到98.7%,然后以异常检测模型输出的异常数据为输入,对模型的泛化能力进行验证的结果也表明了模型分类的高效性。第三步将异常分类模式确定为“测量异常”的数据记录替换为时间序列上的条件均值,依据管网运行数据在时间上的延续性,推测合理的数据替换值。最终实现了人工样本集上的数据校正过程,验证了方法的有效性。最后本文基于实际的供热管网—烟台清泉实业供热系统1#首站集中供热管网中某个热力站上传的运行数据进行数据校正工作,得到了经过修正的流量压力曲线,证明了本文数据校正方法的可行性。