论文部分内容阅读
随着经济的不断发展,电网规模不断扩大,社会用电量不断增加,电网投资额不断增大,电网投资的合理分配也随之成为一个重要问题。然而,目前电网投资决策的方法仍然停留在传统阶段,缺乏科学性与准确性。本文聚焦电网市级分公司的历年投资额及其运营数据,从数据分析的角度、以机器学习的方法,建立了一套基于运营数据的电网基建投资模型。该方法针对现有方法存在的问题,以及电网运营数据数据维度大、数据量小的特点,具有很好的准确性和适用性。本文的主要工作有:一、针对电网运营数据数据维度大的特点,本文以灰色关联分析法为基础,通过计算每个运营数据对于投资额的灰色斜率关联度大小,并综合运营数据本身的类别属性与灰色斜率关联度排序选取合适的数据特征。二、针对传统方法主观性较强和现有电网投资预测模型即灰色模型应对跳变数据能力的不足,本文将统计学习模型应用到电网投资领域,提出了基于回归树的电网投资预测算法。该算法通过挖掘运营数据与投资额的关系,构建了回归树预测模型,实现了某省电网总体投资趋势的预测分析,并提供了影响投资额分配的具体模式。通过对比灰色模型的预测结果,本预测模型的平均预测误差降低了49.8%。三、针对特定城市提出的精准电网投资需求以及电网运营数据样本量不足的现状,本文提出了一种以相似性聚类算法为基础,将相似城市的运营数据共同参与模型训练的样本数据扩充方法,并以此方法为基础提出了针对特定城市的精准预测策略。通过实验结果对比,精准预测策略的平均预测误差相较于总体预测策略的平均预测误差降低了66.1%,同时,基于聚类算法的相似城市数据扩充方法所获得训练数据参与预测的平均误差相较于随机选取相同数量城市数据为训练数据参与预测的平均误差降低了66.9%。