论文部分内容阅读
【摘要】随着经济的快速发展,我国公路货运量也随之增加。本文主要运用非平稳时间序列分析的相关知识和数据分析工具Eviews对历年公路货运量数据进行了相关分析、处理并建立了ARIMA模型,有效的把统计知识与交通运输相结合。文章最后根据所建立的模型举例对未来公路货运量进行了预测。
【关键词】非平稳序列 数据处理 建模 预测
一、预备知识
时间序列分析是一种分析动态数据的统计方法。而每天的公路货运量都是一个随机数,但生活中一些数据往往看似随机却遵循一定的规律。本文主要是针对历年公路货运量做一个统计分析,根据Box-Jenkins建模思想对公路货运量建模。为将非平稳时间序列转化为时间序列模型我们引入乘积季节模型:
?渍(B)U(BS)(1-B)d-(1-BS)Xt=θ(B)V(BS)εt
E(εt)=0,Var(εt)=σ2ε,E(εtεk)=0,(s≠k),EXkεt=0,(■k 其中U(BS)=1-u1BS-u2S-...-uPBPS,V(BS)=1-v1BS-v2B2S-...-vQBQS
可以对不同周期的同一周期点之间的相关性进行拟合?渍(B)=1-?渍1B-?渍2B2-...-?渍PBP,θ(B)=1-θ1B-θ2B2-...-θqBq用来消除同一周期不同周期点之间的相关性。
文中我们研究的货运量记为huoyunliang(t)。
二、实证分析
根据自2009年前公路货运量市场数据,本文选用2001~2008年公路货运量的月度数据,如下表1所示。其中第一行为2001年1月至2001年6月的数据,第二行为2001年7月至2001年12月的數据,以此类推。
通过Eviews作huoyunliang(t)的样本自相关系数和样本偏相关系数图可知序列huoyunliang(t)的样本自相关系数函数具有递减的特征,所以,序列huoyunliang(t)是非平稳的,有一定的趋势性和季节性。为消除趋势性,对序列huoyunliang(t)做一阶差分,差分后的序列可以认为其均值是稳定在零点附近的,因此原序列的线性递增趋势被一阶差分基本消除掉了。可以用通过单位根进一步进行检验来验证我们的结论,这里就不赘述了。为了消除该序列季节效应,我们进一步对数据进行处理分析。经Eviews作图得知序列huoyunliang(t)的自相关函数值在滞后12、24期时仍与0有显著差异,这说明经过一次季节差分后的序列仍具有季节性,序列仍不平稳。由于一般只做一次季节差分,所以在后面所建的模型中需要用季节AR算子UBS(简称SAR)及季节MA算子V(BS)(简称SMA)来消除季节性,以建立乘积季节模型。
(一)序列huoyunliang2(t)的零均值化
用Eviews对序列进行零均值化后huoyunliang3(t)的均值1.09e-13,而其标准差为s=4501.357,所以均值m落在0±2s中,因此接受均值为0的原假设,表明序列huoyunliang3(t)为零均值序列,不必再进行其他变换,可以直接建模。
(二)序列huoyunliang3(t)模型的识别与初步定阶
序列huoyunliang(t)经过一阶差分和一阶季节差分后,仍具有季节效应,因此模型中存在季节AR算子U(BS)及季节MA算子V(BS)。在理论上,季节差分的阶数可以是任意的,但是从实际建模经验来看,Box-Jenkins曾指出:通常季节差分的阶数D不会超过一阶。特别的,对于周期s=12的月度数据序列,季节AR算子U(BS)及季节MA算子V(BS)的阶数很少超过一阶,所以,对原序列huoyunliang(t)应建立ARIMA(p,1,q)12模型。
简单的季节模型,是通过差分与季节差分来消除中学里的周期性的,但是通常的情况是,由于受长期趋势效应、季节效应和随机波动的共同作用,又彼此之间难以分开,所以差分和季节差分不能完全消除季节性,因此在这引入乘积季节模型,记ARIMA(p,d,q)×(P,D,Q)s。
其中,p和q是消除同一周期不同周期点之间相关性的自回归阶数和移动平均阶数,P和Q是消除不同周期的同一周期点之间的相关性的自回归阶数和移动平均阶数,s为周期长度,d为差分阶数,D为季节差分阶数。在序列huoyunliang(t)中,我们知道s=12,d=1,D=1,即为ARIMA(p,1,q)×(P,1,Q)12。从序列huoyunliang3(t)的自相关和偏相关图可以看出,除了在k=12外,■kk在k=5以后波动于零值附近,可以认为■kk在k=3后截尾。又注意到■k在k=3以后(除个别值外)波动于零值附近,我们就可以认为■k在k=3以后截尾。根据Box-Jenkins建模思想可以尝试用ARMA(3,3),ARMA(3,2),AR(3),,AR(2),AR(1)模型,对于序列huoyunliang(t)也就是分别用模型1ARIMA(3,1,3)×(1,1,1)12:,模型2:ARIMA(3,1,2)×(1,1,1)12,模型3:ARIMA(3,1,0)×(1,1,1)12,模型4:ARIMA(2,1,0)×(1,1,1)12模型5:ARIMA(1,1,0)×(1,1,1)12来拟合,其结果分别如下:
由上述各个模型的最小二乘估计结果和AIC的值,可以得到各个参数■1,■2,■3...,■1,■2,■3...,■,■1的估计值和AIC值,在此就不汇总赘述了。根据以上模型的参数估计和AIC值,由AIC准则知,用ARIMA(1,1,0)×(1,1,1)12拟合比较恰当。
利用Eviews软件得到模型ARIMA(1,1,0)×(1,1,1)12的剩余残差序列的自相关和偏相关函数图,部分相关数据如下表2: 从剩余残差的相关图可见,自相关系数和偏相关系数除个别外几乎都落在随机区间以内,由此,认为ARIMA(1,1,0)×(1,1,1)12模型充分拟合了原时间序列。
三、预测
模型为(1-?渍1B)(1-u1B12)(1-B12)huoyunliangt=(1-v1B12)εt
即:(1+a1B+a2B2+a12B12+a13B13+a24B24+a25B25+a26B26)Xt=(1+b1B)εt
a1=-0.7361,a2=-0.2639,a12=-0.5076,a13=0.5076,
其中:a24=-0.4924,a25=0.2285,a26=0.2639,b1=-0.9251即有:
Xt=-a1Xt-1-a2Xt-2-a12Xt-12-a13Xt-13-a24Xt-24-a25Xt-25-a26Xt-26 +εt+b1εt-1
向前做3步预测,根据差分方程预测公式可知:
■t(1)=-a1Xt-1-a2Xt-2-a12Xt-12-a13Xt-13-a24Xt-24-a25Xt-25-a26Xt-26 +εt+b1εt-1
经计算得:■t(1)=151710
同理,■t(2)=154050,■t(3)=152620
所以由以上得:
四、研究结论
第一,近年来,我国公路运输货运量呈非平稳时间序列,且带有一定的趋势性和季节性,我们可以利用乘积季节模型来消除其趋势性和季节性,从而将其转化为平稳时间序列。并建立相应的模型来预测其未来的变化。
第二,采用统计预测的方法对公路货运量可以进行有效的预测。
参考文献
[1]王沁.时间序列分析及其应用[M].成都:西南交通大学出版社,2008(11).
[2]朱慧明.时间序列ARFIMA模型的贝叶斯预测分析[J]. 统计决策,2006(04).
[3]王丽娜,肖冬荣.基于ARMA模型的经济非平稳时间序列的預测分析[N].武汉理工大学学学报(交通科学与工程版),2003.
[4]程毛林.动态数据拟合的叠合模型及其应用[J].运筹与管理,2005(01).
[5]Mario Milanese,and Carlo Novara.Set Membership Prediction of Nonlinear Time Series[J].IEEE Transactions on Automatic Control,2005.
[6]Young,P.Data-based mechanistic modeling of Engineering Systems[J].Journal of Vibration and Control,1998.
基金项目:四川省统计科学研究计划重点项目(2012sc050)。
作者简介:樊志梅,西南交通大学数学学院统计系硕士研究生;赵联文,西南交通大学数学学院教授,硕士生导师;王永平,重庆交通大学交通运输学院硕士研究生。
【关键词】非平稳序列 数据处理 建模 预测
一、预备知识
时间序列分析是一种分析动态数据的统计方法。而每天的公路货运量都是一个随机数,但生活中一些数据往往看似随机却遵循一定的规律。本文主要是针对历年公路货运量做一个统计分析,根据Box-Jenkins建模思想对公路货运量建模。为将非平稳时间序列转化为时间序列模型我们引入乘积季节模型:
?渍(B)U(BS)(1-B)d-(1-BS)Xt=θ(B)V(BS)εt
E(εt)=0,Var(εt)=σ2ε,E(εtεk)=0,(s≠k),EXkεt=0,(■k
可以对不同周期的同一周期点之间的相关性进行拟合?渍(B)=1-?渍1B-?渍2B2-...-?渍PBP,θ(B)=1-θ1B-θ2B2-...-θqBq用来消除同一周期不同周期点之间的相关性。
文中我们研究的货运量记为huoyunliang(t)。
二、实证分析
根据自2009年前公路货运量市场数据,本文选用2001~2008年公路货运量的月度数据,如下表1所示。其中第一行为2001年1月至2001年6月的数据,第二行为2001年7月至2001年12月的數据,以此类推。
通过Eviews作huoyunliang(t)的样本自相关系数和样本偏相关系数图可知序列huoyunliang(t)的样本自相关系数函数具有递减的特征,所以,序列huoyunliang(t)是非平稳的,有一定的趋势性和季节性。为消除趋势性,对序列huoyunliang(t)做一阶差分,差分后的序列可以认为其均值是稳定在零点附近的,因此原序列的线性递增趋势被一阶差分基本消除掉了。可以用通过单位根进一步进行检验来验证我们的结论,这里就不赘述了。为了消除该序列季节效应,我们进一步对数据进行处理分析。经Eviews作图得知序列huoyunliang(t)的自相关函数值在滞后12、24期时仍与0有显著差异,这说明经过一次季节差分后的序列仍具有季节性,序列仍不平稳。由于一般只做一次季节差分,所以在后面所建的模型中需要用季节AR算子UBS(简称SAR)及季节MA算子V(BS)(简称SMA)来消除季节性,以建立乘积季节模型。
(一)序列huoyunliang2(t)的零均值化
用Eviews对序列进行零均值化后huoyunliang3(t)的均值1.09e-13,而其标准差为s=4501.357,所以均值m落在0±2s中,因此接受均值为0的原假设,表明序列huoyunliang3(t)为零均值序列,不必再进行其他变换,可以直接建模。
(二)序列huoyunliang3(t)模型的识别与初步定阶
序列huoyunliang(t)经过一阶差分和一阶季节差分后,仍具有季节效应,因此模型中存在季节AR算子U(BS)及季节MA算子V(BS)。在理论上,季节差分的阶数可以是任意的,但是从实际建模经验来看,Box-Jenkins曾指出:通常季节差分的阶数D不会超过一阶。特别的,对于周期s=12的月度数据序列,季节AR算子U(BS)及季节MA算子V(BS)的阶数很少超过一阶,所以,对原序列huoyunliang(t)应建立ARIMA(p,1,q)12模型。
简单的季节模型,是通过差分与季节差分来消除中学里的周期性的,但是通常的情况是,由于受长期趋势效应、季节效应和随机波动的共同作用,又彼此之间难以分开,所以差分和季节差分不能完全消除季节性,因此在这引入乘积季节模型,记ARIMA(p,d,q)×(P,D,Q)s。
其中,p和q是消除同一周期不同周期点之间相关性的自回归阶数和移动平均阶数,P和Q是消除不同周期的同一周期点之间的相关性的自回归阶数和移动平均阶数,s为周期长度,d为差分阶数,D为季节差分阶数。在序列huoyunliang(t)中,我们知道s=12,d=1,D=1,即为ARIMA(p,1,q)×(P,1,Q)12。从序列huoyunliang3(t)的自相关和偏相关图可以看出,除了在k=12外,■kk在k=5以后波动于零值附近,可以认为■kk在k=3后截尾。又注意到■k在k=3以后(除个别值外)波动于零值附近,我们就可以认为■k在k=3以后截尾。根据Box-Jenkins建模思想可以尝试用ARMA(3,3),ARMA(3,2),AR(3),,AR(2),AR(1)模型,对于序列huoyunliang(t)也就是分别用模型1ARIMA(3,1,3)×(1,1,1)12:,模型2:ARIMA(3,1,2)×(1,1,1)12,模型3:ARIMA(3,1,0)×(1,1,1)12,模型4:ARIMA(2,1,0)×(1,1,1)12模型5:ARIMA(1,1,0)×(1,1,1)12来拟合,其结果分别如下:
由上述各个模型的最小二乘估计结果和AIC的值,可以得到各个参数■1,■2,■3...,■1,■2,■3...,■,■1的估计值和AIC值,在此就不汇总赘述了。根据以上模型的参数估计和AIC值,由AIC准则知,用ARIMA(1,1,0)×(1,1,1)12拟合比较恰当。
利用Eviews软件得到模型ARIMA(1,1,0)×(1,1,1)12的剩余残差序列的自相关和偏相关函数图,部分相关数据如下表2: 从剩余残差的相关图可见,自相关系数和偏相关系数除个别外几乎都落在随机区间以内,由此,认为ARIMA(1,1,0)×(1,1,1)12模型充分拟合了原时间序列。
三、预测
模型为(1-?渍1B)(1-u1B12)(1-B12)huoyunliangt=(1-v1B12)εt
即:(1+a1B+a2B2+a12B12+a13B13+a24B24+a25B25+a26B26)Xt=(1+b1B)εt
a1=-0.7361,a2=-0.2639,a12=-0.5076,a13=0.5076,
其中:a24=-0.4924,a25=0.2285,a26=0.2639,b1=-0.9251即有:
Xt=-a1Xt-1-a2Xt-2-a12Xt-12-a13Xt-13-a24Xt-24-a25Xt-25-a26Xt-26 +εt+b1εt-1
向前做3步预测,根据差分方程预测公式可知:
■t(1)=-a1Xt-1-a2Xt-2-a12Xt-12-a13Xt-13-a24Xt-24-a25Xt-25-a26Xt-26 +εt+b1εt-1
经计算得:■t(1)=151710
同理,■t(2)=154050,■t(3)=152620
所以由以上得:
四、研究结论
第一,近年来,我国公路运输货运量呈非平稳时间序列,且带有一定的趋势性和季节性,我们可以利用乘积季节模型来消除其趋势性和季节性,从而将其转化为平稳时间序列。并建立相应的模型来预测其未来的变化。
第二,采用统计预测的方法对公路货运量可以进行有效的预测。
参考文献
[1]王沁.时间序列分析及其应用[M].成都:西南交通大学出版社,2008(11).
[2]朱慧明.时间序列ARFIMA模型的贝叶斯预测分析[J]. 统计决策,2006(04).
[3]王丽娜,肖冬荣.基于ARMA模型的经济非平稳时间序列的預测分析[N].武汉理工大学学学报(交通科学与工程版),2003.
[4]程毛林.动态数据拟合的叠合模型及其应用[J].运筹与管理,2005(01).
[5]Mario Milanese,and Carlo Novara.Set Membership Prediction of Nonlinear Time Series[J].IEEE Transactions on Automatic Control,2005.
[6]Young,P.Data-based mechanistic modeling of Engineering Systems[J].Journal of Vibration and Control,1998.
基金项目:四川省统计科学研究计划重点项目(2012sc050)。
作者简介:樊志梅,西南交通大学数学学院统计系硕士研究生;赵联文,西南交通大学数学学院教授,硕士生导师;王永平,重庆交通大学交通运输学院硕士研究生。