论文部分内容阅读
摘 要:基于我国电网运行效率低、指标体系建立具有局限性的状况,首先提出了一种基于大数据的电网运行效率指标筛选方法,通过指标筛选,建立了一套可靠有效的评价指标体系;然后经指标归一化处理、指标权重计算,对指标体系中各指标进行详细的评价分析;最后将此指标体系用于河北省电力公司,对其进行综合评分,列出评分结果。该实例结果验证了基于大数据建立的指标体系的可靠性和有效性。
關键词:电网运行效率 指标体系 大数据 指标归一化 有效性
中图分类号:TM769 文献标识码:A 文章编号:1674-098X(2016)12(b)-0001-03
随着国民生活质量的逐渐提高,用户用电量与日俱增,电网的投资规模也逐渐扩大,如何以最小的投资满足国民用电需求、提高电网运行效率[1]显得愈发重要。若要提高电网的运行效率,首先应建立一套科学的电网运行效率指标体系,并对其进行有效分析,即电网运行效率指标评价。目前大多数对电网运行效率的评价方法都较单一,建立的指标是从固定指标里抽取出来的,这样的指标具有局限性,不能全面描述电网的运行效率。该文针对这种指标局限性,创新性地提出了一种基于大数据的筛选指标、建立指标并评价指标的方法。
1 基于大数据的指标筛选
目前科学技术快速发展,“数据爆炸”[2]这一名词日益为人们所熟悉,它是在现代技术“互联网”“物联网”“云计算”等的推动下快速发展起来的,现在就是一个“得数据者得天下”的社会,电网也应抓住时代机会,利用“电网互联”获得的数据对电网进行有效的分析。
“大数据”一般指的是需要处理的信息量较大、超出一般电脑处理数据内存量的数据,由于目前大数据还处于初步研究阶段,其定义尚未达成共识,但它在互联网、科技与国防军事、政府管理等领域已成为信息化改革的核心。电力大数据有着大数据的特点,即数据数量多、数据类型多、价值数据少、数据处理速度快等。电力系统中的数据主要来源于发电、输电、变电、配电、用电等环节中连接的传感器和测量仪器仪表。
所有电力网中的电力数据的集合即为电力大数据,基于这些数据进行系统的分析,利用相关分析法全范围地抽取有效的电网运行效率指标,且这些指标间相互独立——即基于大数据的电网运行效率指标,它不再是人为地认定某些指标比较重要,而是利用大数据全范围地抽取有效指标。这种基于大数据的指标筛选,不仅充分弥补了人为筛选指标的局限性,更可以很好地反映电网运行效率。
2 电网运行效率评价模型的构建
基于大数据的指标,数量既多又杂,有些指标可能无效或指标间可能有关联,若直接将这些指标用于指标评价,会因部分数据重复而影响评价结果,因此,构建科学有效的电网运行效率评价模型,则必须提前对这些指标进行处理,处理的过程包括:(1)指标简约;(2)指标归一化;(3)指标的权重计算;(4)综合评分。
2.1 指标简约
对大数据的所有指标进行初步筛选,筛选出与电网运行效率有关的指标,由于数据量庞大,这个过程由计算机完成。假设初步筛选出的指标有p个,这些指标间可能存在关联,因此,需对其进行指标简约。将p个指标进行分类,设分为m类,则有指标矩阵:
(1)
其中:第一行、第二行、第m行分别代表第一类、第二类、第m类指标,代表第一类、第二类、第m类指标的个数,且。
求各个指标的相关性矩阵。每两个指标间都有一个相关系数γ,γ的取值可以表示两个指标间的相关程度,其计算公式如下:
(2)
其中:γ的取值范围为[-1,1]。当γ为正值时,表示两个指标呈正相关;反之,为负相关。|γ|越接近于1表示两个指标的相关性越强,当时,表示两个指标完全相关;当时,表示两个指标完全不相关,即相互独立;当时,表示两个指标基本不相关;当时,表示两个指标低度相关;当时,表示两个指标显著相关;当时,表示两个指标高度相关。式中的、代表同一类指标中任意两个指标x、y的第i个采样值,、为这两个指标采样值的平均值,其计算公式如下:
(3)
(4)
其中,n为指标的采样数量,将公式(3)和(4)中的值带入公式(2),可以计算出每两个指标间的相关系数,将这些相关系数按照一定的顺序排列,即可形成指标的相关性矩阵,如表1所示。
相关性矩阵中,代表的是类指标中第p个指标和第q个指标间的相关系数,同一个指标间的相关系数为1。根据相关性矩阵中相关系数的数值对指标进行约简,约简原则如下。
(1)对于相关系数大于0.8的两个指标,删除一个,保留一个。
(2)对与任何两个以上指标的相关系数都处于0.5~0.8之间的指标进行删除。
按照以上的原则进行筛选后的指标,即为基于大数据约简后的指标。
2.2 指标归一化
指标体系中,各指标类型可能不同,比如绝对量型指标、无量型指标和比值型指标,这些指标属性不同,数据范围差异大,不便于指标评价的后续计算,因此,须对这些指标数据进行归一化处理。其步骤如下。
(1)确定指标的阈值。
根据经验值将不合理的数据剔除,剩下的数据按照其范围进行分组,统计落在各组内的频数,将频数最大组的上下限作为该指标的阈值。
(2)确定指标的隶属度函数。
根据指标的数据情况来拟合指标的隶属度函数,其可以为线性或非线性,当数据不充足时可选择线性函数。隶属度函数分为戎上型、戎下型和中间型,根据指标的特性来选择,如:正指标选择戎上型;逆指标选择戎下型;适度指标选择中间型。
2.3 指标权重计算
各指标对电网运行效率的影响程度有差异,因此需对其进行权重分配。该文采用变异系数法对各个指标的权重进行计算,可以避免指标数据的量纲和数量级不同带来的影响。 变异系数法根据指标的变异程度来对其进行权重分配,即直接将变异系数法处理后的数据作为其权重系数。变异系数越大,则其对应的指标对评价的影响也就越大。设有P个电网运行效率指标共分为m类,指标矩阵如公式(1),计算权重过程如下。
(1)计算各指标的标准差。
(5)
其中,为某一类指标中第i个指标的标准差,为该指标的第i个采样值,为该指标的平均值,其计算如公式3。
(2)计算各指标的变异系数。
(6)
其中,为某一类指标中第i个指标的变异系数。
(3)各指标变异系数的归一化处理。
(7)
其中,为该指标的权重系数。
2.4 综合评分
线性综合评分方法有着直观、易实现的优点,且与实际工作相似,因此,该文采取该方法对各个电力公司进行综合评分。其计算公式如下:
(8)
其中,y为某一电力公司的综合评分,p为该公司的电网运行效率指标总数,为第i个评价指标值,为其权重系数。
3 实例分析
以2014年河北电网220 kV电压等级的运行数据为依据,基于大数据和相关性分析筛选出电网运行效率指标,其有效指标如表2所示。基于这些指标对河北省6个地市公司指标约简前和指标约简后分别进行评分,并将评分进行对比,其评分结果如表3所示。
由表2可知,基于大数据共筛选出13个电网运行效率指标,构成电网运行效率的指标体系,这些指标之间相互独立,且各指标对电网评价的影响权重不同,表中指标是按照权重分量依次递减排序,权重分量总和为1。
通过对各电力公司的实际调研可知:表3的地市公司评分结果与实际情况较为接近,基本反映了各地市公司电网运行效率的情况。地市6、3、1、4,其所处位置为城区,经济较发达,工业化发展快,电力需求量和售电量较大,变压器效率高,线损率低,因此其综合评分较高;地市2、5,其电网结构中农网比例较大,虽然电网投入增加,但售电量增量相对缓慢,且设备的利用率低,线损率大,导致其综合评分较差。
4 结语
通過对我国电网运行现状的研究,了解到电网运行效率的评价指标选取不完善,提出了大数据概念,并基于大数据对电网运行效率的指标进行相关性筛选,建立了一套可靠的电网运行效率指标体系;然后进行指标归一化、指标权重计算,对该指标体系进行评价;最后将此指标体系用于河北省电网公司,对其电网运行效率综合评分。实例结果表明了基于大数据的电网运行效率指标评价的有效性和可靠性,为电网的投资提供了有力的依据。
参考文献
[1] 宋伶俐,邓长虹,吴耀文,等.基于相关性分析法的电网设备运行效率评价指标[J].中国电力,2012(9):85-90.
[2] 马坤隆.基于大数据的分布式短期负荷预测方法[D].湖南大学,2014.
關键词:电网运行效率 指标体系 大数据 指标归一化 有效性
中图分类号:TM769 文献标识码:A 文章编号:1674-098X(2016)12(b)-0001-03
随着国民生活质量的逐渐提高,用户用电量与日俱增,电网的投资规模也逐渐扩大,如何以最小的投资满足国民用电需求、提高电网运行效率[1]显得愈发重要。若要提高电网的运行效率,首先应建立一套科学的电网运行效率指标体系,并对其进行有效分析,即电网运行效率指标评价。目前大多数对电网运行效率的评价方法都较单一,建立的指标是从固定指标里抽取出来的,这样的指标具有局限性,不能全面描述电网的运行效率。该文针对这种指标局限性,创新性地提出了一种基于大数据的筛选指标、建立指标并评价指标的方法。
1 基于大数据的指标筛选
目前科学技术快速发展,“数据爆炸”[2]这一名词日益为人们所熟悉,它是在现代技术“互联网”“物联网”“云计算”等的推动下快速发展起来的,现在就是一个“得数据者得天下”的社会,电网也应抓住时代机会,利用“电网互联”获得的数据对电网进行有效的分析。
“大数据”一般指的是需要处理的信息量较大、超出一般电脑处理数据内存量的数据,由于目前大数据还处于初步研究阶段,其定义尚未达成共识,但它在互联网、科技与国防军事、政府管理等领域已成为信息化改革的核心。电力大数据有着大数据的特点,即数据数量多、数据类型多、价值数据少、数据处理速度快等。电力系统中的数据主要来源于发电、输电、变电、配电、用电等环节中连接的传感器和测量仪器仪表。
所有电力网中的电力数据的集合即为电力大数据,基于这些数据进行系统的分析,利用相关分析法全范围地抽取有效的电网运行效率指标,且这些指标间相互独立——即基于大数据的电网运行效率指标,它不再是人为地认定某些指标比较重要,而是利用大数据全范围地抽取有效指标。这种基于大数据的指标筛选,不仅充分弥补了人为筛选指标的局限性,更可以很好地反映电网运行效率。
2 电网运行效率评价模型的构建
基于大数据的指标,数量既多又杂,有些指标可能无效或指标间可能有关联,若直接将这些指标用于指标评价,会因部分数据重复而影响评价结果,因此,构建科学有效的电网运行效率评价模型,则必须提前对这些指标进行处理,处理的过程包括:(1)指标简约;(2)指标归一化;(3)指标的权重计算;(4)综合评分。
2.1 指标简约
对大数据的所有指标进行初步筛选,筛选出与电网运行效率有关的指标,由于数据量庞大,这个过程由计算机完成。假设初步筛选出的指标有p个,这些指标间可能存在关联,因此,需对其进行指标简约。将p个指标进行分类,设分为m类,则有指标矩阵:
(1)
其中:第一行、第二行、第m行分别代表第一类、第二类、第m类指标,代表第一类、第二类、第m类指标的个数,且。
求各个指标的相关性矩阵。每两个指标间都有一个相关系数γ,γ的取值可以表示两个指标间的相关程度,其计算公式如下:
(2)
其中:γ的取值范围为[-1,1]。当γ为正值时,表示两个指标呈正相关;反之,为负相关。|γ|越接近于1表示两个指标的相关性越强,当时,表示两个指标完全相关;当时,表示两个指标完全不相关,即相互独立;当时,表示两个指标基本不相关;当时,表示两个指标低度相关;当时,表示两个指标显著相关;当时,表示两个指标高度相关。式中的、代表同一类指标中任意两个指标x、y的第i个采样值,、为这两个指标采样值的平均值,其计算公式如下:
(3)
(4)
其中,n为指标的采样数量,将公式(3)和(4)中的值带入公式(2),可以计算出每两个指标间的相关系数,将这些相关系数按照一定的顺序排列,即可形成指标的相关性矩阵,如表1所示。
相关性矩阵中,代表的是类指标中第p个指标和第q个指标间的相关系数,同一个指标间的相关系数为1。根据相关性矩阵中相关系数的数值对指标进行约简,约简原则如下。
(1)对于相关系数大于0.8的两个指标,删除一个,保留一个。
(2)对与任何两个以上指标的相关系数都处于0.5~0.8之间的指标进行删除。
按照以上的原则进行筛选后的指标,即为基于大数据约简后的指标。
2.2 指标归一化
指标体系中,各指标类型可能不同,比如绝对量型指标、无量型指标和比值型指标,这些指标属性不同,数据范围差异大,不便于指标评价的后续计算,因此,须对这些指标数据进行归一化处理。其步骤如下。
(1)确定指标的阈值。
根据经验值将不合理的数据剔除,剩下的数据按照其范围进行分组,统计落在各组内的频数,将频数最大组的上下限作为该指标的阈值。
(2)确定指标的隶属度函数。
根据指标的数据情况来拟合指标的隶属度函数,其可以为线性或非线性,当数据不充足时可选择线性函数。隶属度函数分为戎上型、戎下型和中间型,根据指标的特性来选择,如:正指标选择戎上型;逆指标选择戎下型;适度指标选择中间型。
2.3 指标权重计算
各指标对电网运行效率的影响程度有差异,因此需对其进行权重分配。该文采用变异系数法对各个指标的权重进行计算,可以避免指标数据的量纲和数量级不同带来的影响。 变异系数法根据指标的变异程度来对其进行权重分配,即直接将变异系数法处理后的数据作为其权重系数。变异系数越大,则其对应的指标对评价的影响也就越大。设有P个电网运行效率指标共分为m类,指标矩阵如公式(1),计算权重过程如下。
(1)计算各指标的标准差。
(5)
其中,为某一类指标中第i个指标的标准差,为该指标的第i个采样值,为该指标的平均值,其计算如公式3。
(2)计算各指标的变异系数。
(6)
其中,为某一类指标中第i个指标的变异系数。
(3)各指标变异系数的归一化处理。
(7)
其中,为该指标的权重系数。
2.4 综合评分
线性综合评分方法有着直观、易实现的优点,且与实际工作相似,因此,该文采取该方法对各个电力公司进行综合评分。其计算公式如下:
(8)
其中,y为某一电力公司的综合评分,p为该公司的电网运行效率指标总数,为第i个评价指标值,为其权重系数。
3 实例分析
以2014年河北电网220 kV电压等级的运行数据为依据,基于大数据和相关性分析筛选出电网运行效率指标,其有效指标如表2所示。基于这些指标对河北省6个地市公司指标约简前和指标约简后分别进行评分,并将评分进行对比,其评分结果如表3所示。
由表2可知,基于大数据共筛选出13个电网运行效率指标,构成电网运行效率的指标体系,这些指标之间相互独立,且各指标对电网评价的影响权重不同,表中指标是按照权重分量依次递减排序,权重分量总和为1。
通过对各电力公司的实际调研可知:表3的地市公司评分结果与实际情况较为接近,基本反映了各地市公司电网运行效率的情况。地市6、3、1、4,其所处位置为城区,经济较发达,工业化发展快,电力需求量和售电量较大,变压器效率高,线损率低,因此其综合评分较高;地市2、5,其电网结构中农网比例较大,虽然电网投入增加,但售电量增量相对缓慢,且设备的利用率低,线损率大,导致其综合评分较差。
4 结语
通過对我国电网运行现状的研究,了解到电网运行效率的评价指标选取不完善,提出了大数据概念,并基于大数据对电网运行效率的指标进行相关性筛选,建立了一套可靠的电网运行效率指标体系;然后进行指标归一化、指标权重计算,对该指标体系进行评价;最后将此指标体系用于河北省电网公司,对其电网运行效率综合评分。实例结果表明了基于大数据的电网运行效率指标评价的有效性和可靠性,为电网的投资提供了有力的依据。
参考文献
[1] 宋伶俐,邓长虹,吴耀文,等.基于相关性分析法的电网设备运行效率评价指标[J].中国电力,2012(9):85-90.
[2] 马坤隆.基于大数据的分布式短期负荷预测方法[D].湖南大学,2014.