论文部分内容阅读
【摘要】由于国内市场开发滞后和多晶硅生产厂家增长迅速,会造成生产和销售不匹配所导致的过剩问题或供不应求的问题。为了解决这个问题,我们用回归分析法来预测未来几年太阳光伏公司需要生产的组件数量,以使达到生产和销售之间关系的最优化。
【关键词】回归分析;回归方程;光伏组件
引言
在严峻的能源和生态环境形势压力下,世界光伏产业和市场自20世纪90年代后半期进入了快速发展的时期[1]。其中全球太阳组件产量年均复合增长率为47%[2],这已经成为世界上发展最快的产业之一。就我国而言,近年来太阳能光伏组件生产量和市场销售量分别以年均15%和20%的速度增长[3]。并且,2011年我国多金硅产量占全球约37%的份额[4],这个比重是相当大的。但是由于国内市场开发滞后和多晶硅生产厂家增长迅速,造成了生产和应用不匹配,从而导致我国太阳能光伏组件出现生产过剩的问题[5]。为了避免生产和销售不匹配所导致的过剩问题或供不应求,我们需要预先对将要生产的组件数量做一个相应的预测。
模型建立
要预测厂家未来几年的生产量,需要事先了解近几年厂家的生产量。要得到供货量与生产量之间的关系,我们需要了解厂商出货量,因此,我们先来分析下未来几年出货量的情况。
1、出货量的预测及控制
1.1数据采集
我们选取以中国光伏集团东营光伏太阳能有限公司为例来分析生产量和供货量之间的关系。2007年至2011年该公司光伏组件的出货量,见表1[6]。
表1 中国光伏集团东营光伏太阳能有限公司
年份 2007 2008 2009 2010 2011
第X年 1 2 3 4 5
出货量(MWP) 11 49.81 50 158 191
1.2回归分析
1)通过matlab作出散点图,如图1所示。
从图上我们发现随着年份的增加,出货量y也以一定的比例增加,且这些点近似在一条直线上,又不完全在一条直线上。引起这些点与直线偏离的原因是因为生产过程中存在一些不可控因素,而这些因素也影响着生产量y。
2)建立年份与出货量的关系方程
设X表示第X年,y表示出货量,通过对图1的观察,可设出货量的预测值,其中,给定观测值:
则
回归模型参数计算如表2所示:
第x年、出货量y的均值分别为各均值平方和为的标准差分别为,,;
根据公式可得的最小二乘估计为, ;
代入回归方程得:
1.3出货量的预测
由第x年与出货量y间回归方程就可以预测2012年至2014年的出货量。根据1.1的假设,我们可以知道
当x=6时,即2012年,出货量y=232.422(MWP),这说明2012年公司应生产组件232.422MWP。
当x=7时,即2013年,出货量y=279.242(MWP),这说明2013年公司应生产组件279.242MWP。
当x=8时,即2014年,出货量y=326.062(MWP),这说明2014年公司应生产组件326.062MWP。
2.生产量的预测及控制
2.1数据采集
有了出货量,我们就可以对厂家的生产量进行分析和预测,为了了解光伏组件厂家的生产、出货情况,我们选取中国光伏集团东营光伏太阳能有限公司2008年至2011年光伏组件的生产量、出货量,见表3[6]。
表3 中国光伏集团东营光伏太阳能有限公司
年份 2008 2009 2010 2011
出货量(MWP) 49.81 50 158 191
生产量(MWP) 60 80 165.3 205
2.2回归分析
1)通过matlab作出散点图,如图2所示。
从图上我们发现随着供货量x的增加,生产量z也以一定的比例增加,且这些点近似在一条直线上,又不完全在一条直线上。引起这些点与直线偏离的原因是因为生产过程中存在一些不可控因素,而这些因素也影响着生产量z。
2)建立出货量与生产量的关系方程
假设z表示年生产量,x表示年出货量,通过对图2的观察,可设生产量的预测值,其中,给定观测值:
则
回归模型参数计算如表4所示:
供货量x、生产量z的均值分别为,
;各均值平方和,
;x、z的标准差分别,
,;
代入相应公式可得a0、a1的最小二乘估计为,
;
带入回归方程得:
2.3线性回归模型的检验
供货量x与生产量z间的数量关系式求得后,要对数量关系式的可信度进行统计检验。
假设
我们通常利用数据的总偏差平方和来衡量数据波动的大小,所以先计算个偏差平方和。
回归平方和,主要反映了由变量xi的变化引起的zi的波动:
残差平方和,主要反映了除去E(z)与xi之间的线性关系以外一切因素引起的zi的波动:
总离差平方和:
检验统计量:
如果我们选取置信水平,
查F检验的临界值表,得临界值
因为
故拒绝H0
即认为回归方程
在水平下有显著意义。因此,我们完全可用这个公式来对未来公司的生产总量提前作出預测。
2.4生产量的预测
由1.4预测的2012年至2014年的出货量我们就可以利用出货量和生产量间的回归方程来预测2012年至2014年的生产量。于是,
2012年:出货量y=232.422(MWP),即x=232.422时,生产量 z=239.38(MWP)
2013年:出货量y=279.242(MWP),即x=279.242时,生产量 z=282.93(MWP)
2014年:出货量y=326.062(MWP),即x=326.062时,生产量 z=326.47(MWP)结果如下表:
表5 2012年至2014年中国光伏集团东营光伏太阳能有限公司
年份 2012 2013 2014
生产量(MWP) 239.38 282.93 326.47
结论
通过查询该公司2012年至2014年的生产能力,与我们预测出的生产量接近,因此我们可以说预测结果是可靠的。
【关键词】回归分析;回归方程;光伏组件
引言
在严峻的能源和生态环境形势压力下,世界光伏产业和市场自20世纪90年代后半期进入了快速发展的时期[1]。其中全球太阳组件产量年均复合增长率为47%[2],这已经成为世界上发展最快的产业之一。就我国而言,近年来太阳能光伏组件生产量和市场销售量分别以年均15%和20%的速度增长[3]。并且,2011年我国多金硅产量占全球约37%的份额[4],这个比重是相当大的。但是由于国内市场开发滞后和多晶硅生产厂家增长迅速,造成了生产和应用不匹配,从而导致我国太阳能光伏组件出现生产过剩的问题[5]。为了避免生产和销售不匹配所导致的过剩问题或供不应求,我们需要预先对将要生产的组件数量做一个相应的预测。
模型建立
要预测厂家未来几年的生产量,需要事先了解近几年厂家的生产量。要得到供货量与生产量之间的关系,我们需要了解厂商出货量,因此,我们先来分析下未来几年出货量的情况。
1、出货量的预测及控制
1.1数据采集
我们选取以中国光伏集团东营光伏太阳能有限公司为例来分析生产量和供货量之间的关系。2007年至2011年该公司光伏组件的出货量,见表1[6]。
表1 中国光伏集团东营光伏太阳能有限公司
年份 2007 2008 2009 2010 2011
第X年 1 2 3 4 5
出货量(MWP) 11 49.81 50 158 191
1.2回归分析
1)通过matlab作出散点图,如图1所示。
从图上我们发现随着年份的增加,出货量y也以一定的比例增加,且这些点近似在一条直线上,又不完全在一条直线上。引起这些点与直线偏离的原因是因为生产过程中存在一些不可控因素,而这些因素也影响着生产量y。
2)建立年份与出货量的关系方程
设X表示第X年,y表示出货量,通过对图1的观察,可设出货量的预测值,其中,给定观测值:
则
回归模型参数计算如表2所示:
第x年、出货量y的均值分别为各均值平方和为的标准差分别为,,;
根据公式可得的最小二乘估计为, ;
代入回归方程得:
1.3出货量的预测
由第x年与出货量y间回归方程就可以预测2012年至2014年的出货量。根据1.1的假设,我们可以知道
当x=6时,即2012年,出货量y=232.422(MWP),这说明2012年公司应生产组件232.422MWP。
当x=7时,即2013年,出货量y=279.242(MWP),这说明2013年公司应生产组件279.242MWP。
当x=8时,即2014年,出货量y=326.062(MWP),这说明2014年公司应生产组件326.062MWP。
2.生产量的预测及控制
2.1数据采集
有了出货量,我们就可以对厂家的生产量进行分析和预测,为了了解光伏组件厂家的生产、出货情况,我们选取中国光伏集团东营光伏太阳能有限公司2008年至2011年光伏组件的生产量、出货量,见表3[6]。
表3 中国光伏集团东营光伏太阳能有限公司
年份 2008 2009 2010 2011
出货量(MWP) 49.81 50 158 191
生产量(MWP) 60 80 165.3 205
2.2回归分析
1)通过matlab作出散点图,如图2所示。
从图上我们发现随着供货量x的增加,生产量z也以一定的比例增加,且这些点近似在一条直线上,又不完全在一条直线上。引起这些点与直线偏离的原因是因为生产过程中存在一些不可控因素,而这些因素也影响着生产量z。
2)建立出货量与生产量的关系方程
假设z表示年生产量,x表示年出货量,通过对图2的观察,可设生产量的预测值,其中,给定观测值:
则
回归模型参数计算如表4所示:
供货量x、生产量z的均值分别为,
;各均值平方和,
;x、z的标准差分别,
,;
代入相应公式可得a0、a1的最小二乘估计为,
;
带入回归方程得:
2.3线性回归模型的检验
供货量x与生产量z间的数量关系式求得后,要对数量关系式的可信度进行统计检验。
假设
我们通常利用数据的总偏差平方和来衡量数据波动的大小,所以先计算个偏差平方和。
回归平方和,主要反映了由变量xi的变化引起的zi的波动:
残差平方和,主要反映了除去E(z)与xi之间的线性关系以外一切因素引起的zi的波动:
总离差平方和:
检验统计量:
如果我们选取置信水平,
查F检验的临界值表,得临界值
因为
故拒绝H0
即认为回归方程
在水平下有显著意义。因此,我们完全可用这个公式来对未来公司的生产总量提前作出預测。
2.4生产量的预测
由1.4预测的2012年至2014年的出货量我们就可以利用出货量和生产量间的回归方程来预测2012年至2014年的生产量。于是,
2012年:出货量y=232.422(MWP),即x=232.422时,生产量 z=239.38(MWP)
2013年:出货量y=279.242(MWP),即x=279.242时,生产量 z=282.93(MWP)
2014年:出货量y=326.062(MWP),即x=326.062时,生产量 z=326.47(MWP)结果如下表:
表5 2012年至2014年中国光伏集团东营光伏太阳能有限公司
年份 2012 2013 2014
生产量(MWP) 239.38 282.93 326.47
结论
通过查询该公司2012年至2014年的生产能力,与我们预测出的生产量接近,因此我们可以说预测结果是可靠的。