论文部分内容阅读
摘要通过对1978~2012年浈江历年年径流量数据分析,建立时间序列模型。在模型的建立过程中,使用SPSS软件,对不同阶数的ARIMA模型进行比较,按照最小信息量原则选择最优模型ARIMA(4,1,0),并且使用该模型对2013~2016年径流量进行预测。
关键词时间序列分析;ARIMA;SPSS;年径流量
中图分类号S11文献标识码A文章编号0517-6611(2015)21-023-02
水文预报直接为防汛抢险、水资源的合理利用与保护、水利工程的建设和调度运行管理以及工农业生产提供服务。这是水文研究的重要内容。径流量预测是水资源系统分析中一个很重要的内容,可以为水资源合理开发和优化利用、区域社会经济规划的制定提供必要的导向,尤其是对水库合理调度的指导意义不容忽视。年径流量的预报对于制定生产计划、防洪、抗旱、发电、水资源的规划管理和综合利用有着十分重要的意义。
1时间序列模型
目前,对径流量的预测方法有回归分析模型[1]、人工神经网络[2-4]、模糊数学模型[5-6]、灰色系统模型[7-8]以及时间序列模型[9-11]。但是,径流形成固有的不确定性和复杂性使得人们对径流过程演变认识、模拟、预测具有非唯一性,且径流量本身存在很多不确定因素及很强的波动性,使得有些方法的预测精度往往不高。
时间序列分析属于概率统计学科的一个重要分支,近些年得到迅速发展,其实际应用遍及自然科学、社会科学以及工程技术的诸多领域。时间序列分析的若干理论已经相当成熟,特别是对于线性平稳时间序列,其多种模型己被广泛应用于各领域的控制和预测。
时间序列分析不通过其他变量对所观测时间序列{Xt}的行为做结构性解释分析,而是根据数据自身特点,为它建立一个能够反映时间序列过去行为的模型,以帮助我们预测未来行为。
我们把具有如下结构的模型称为自回归移动平均模型,简记为ARMA(p,q)。
xt=0+1xt-1+…+pxt-p+εt-θ1εt-1-…-θqεt-q
p≠0,θq≠0
E(εt)=0,Var(εt)=σ2ε,E(εtεs)=0,s≠t
Extεt=0,s<1
若0=0,则该模型被称为中心化ARMA(p,q)模型。缺省默认条件,中心化ARMA(p,q)模型可以简写为xt=1xt-1+…+pxt-p+εt-θ1εt-1-…-θqεt-q。
其中,{xt}为平稳的时间序列;
{εt}为白噪声序列;
1,2,…p,θ1,θ2,…θq为常数。
ARIMA(p,q)模型的实质就是差分运算与ARMA模型的组合。这说明任何非平稳序列只要通过适当阶数的差分实现差分后平稳,就可以对差分后序列进行ARMA模型拟合。
2使用时间序列模型建模
韶关市地处粤北山区,水资源年际变化大,年内分配不均,受气候、水文和地理条件的制约,在洪水期易产生山洪而枯水期又易出现旱灾。自建国以来,韶关市旱情较严重的年份有1955、1963、1977、1986、2004、2009年,尤其是2001~2004年的多年连旱对韶关市经济发展和人们的日常生活造成重大损失。
图1为1978~2012年浈江年径流量数据折线图。由图2可知,浈江历年年径流量稍有递增趋势,各阶的自相关和偏自相关系数有一定的规律性,大都取负值,而非在零值附近波动。因此,对原始序列进行一阶差分,对一阶差分后数据做出自相关和偏自相关系数图形。
图3显示一阶差分后数据自相关系数拖尾,偏自相关系数可以近似看成四阶截尾。因此,选择ARIMA(2,1,0),ARIMA(3,1,0),ARIMA(4,1,0)以及ARIMA(5,1,0)模型。综合比较模型参数,选择较优模型。模型参数见表1。BIC准则适用于样本数据较少的问题,目的是判断预测目标的发展过程与哪一随机过程最接近。具体的使用原则是在规定
范围内选择BIC值最小的模型。选择ARIMA(4,1,0)建立
模型,模型参数如表2所示。
用对信息的提取是否充分来判断模型的有效性,使用LjungBox检验统计量,判断法则为当检验统计量的P值大于显著性水平α时,认为残差是白噪声序列,否则说明残差
序列中还残留着相关信息,拟合模型不显著。由表1可知,
当使用ARIMA(4,1,0)模型建模时,其LjungBox统计量的显著性(α)为0.721,远大于显著性水平α(取α=0.05),可以认为残差是白噪声序列。进而,图4给出建立ARIMA(4,1,0)模型之后残差的自相关和偏自相关序列图,基本在零值附近波动,则模型有效。
当使用ARIMA(4,1,0)模型建模时,其模型参数见表2。参数检验结果显示,AR(1)、AR(2)、AR(3)、AR(4)系数均显著。使用ARIMA(4,1,0)模型对浈江2013~2016年年径流量进行预测,预测2013、2014、2015及2016年年径流量分别为51.46亿、58.88亿、6012亿以及63.09亿m3。其置信上限、置信下限见表3。把历年观察值数据、拟合值以及预测值曲线绘制到同一个坐标轴中,如图5所示。
3结论
通过对ARIMA模型理论的介绍和研究,对浈江年径流量建立多个ARIMA模型。按照一定的原则,选择较优的模型,并且对模型参数进行估计,对近4年的年径流量做预报分析。
水文预报的方法很多,然而对于中长期预报,目前还没有一种模型对所有的水文序列适用。预报模型的适用性至今仍是有待深入研究的問题。对于一个具体水文序列长期预报问题,往往通过对具体的数据进行分析、尝试、检验等步骤,最终找到较适合的预报模型。
参考文献
[1] 顾绮仪.长期水文统计预报方法在长江大通站径流预报中的应用[J].应用技术,2005,3(1):42-43.
[2] 蔡煜东,许伟杰.自组织人工神经网络在鄱阳湖年最高水位长期预报中的应用[J].水文科技情报,1993,10(2):27-29.
[3] 钟登华,王仁超,皮钧.水文预报时间序列神经网络模型[J].水利学报,1995(2):69-75.
[4] 张利平,王德智,夏军.白山水库径流中长期预报研究与应用[J].水电能源科学,2002(3):18-20.
[5] 陈守煜.中长期水文预报综合分析理论模式与方法[J].水利学报,1997(8):15-32.
[6] 白子岩.模糊模式识别法在中长期预报中的应用[J].水利水电技术,1999,30(2):50-51.
[7] 谢科范.评灰色系统理论[J].系统工程,1991,9(4):49-52.
[8] 夏军.灰色系统水文学理论方法及应用[M].武汉:华中理工大学出版社,1999:36-47.
[9] 洪时中.非线性时间序列分析的最新进展及其在地球科学中的应用前景[J].地球科学进展,1999,14(6):559.
[10] OOMS M,FRANSES P H.A seasonal periodic long memory model for monthly river flows[J].Environmental Modeling&Software,2001,16:559-569.
[11] 张小静.函数系数自回归模型在水文预报中的应用[D].西安:西安理工大学,2007.
关键词时间序列分析;ARIMA;SPSS;年径流量
中图分类号S11文献标识码A文章编号0517-6611(2015)21-023-02
水文预报直接为防汛抢险、水资源的合理利用与保护、水利工程的建设和调度运行管理以及工农业生产提供服务。这是水文研究的重要内容。径流量预测是水资源系统分析中一个很重要的内容,可以为水资源合理开发和优化利用、区域社会经济规划的制定提供必要的导向,尤其是对水库合理调度的指导意义不容忽视。年径流量的预报对于制定生产计划、防洪、抗旱、发电、水资源的规划管理和综合利用有着十分重要的意义。
1时间序列模型
目前,对径流量的预测方法有回归分析模型[1]、人工神经网络[2-4]、模糊数学模型[5-6]、灰色系统模型[7-8]以及时间序列模型[9-11]。但是,径流形成固有的不确定性和复杂性使得人们对径流过程演变认识、模拟、预测具有非唯一性,且径流量本身存在很多不确定因素及很强的波动性,使得有些方法的预测精度往往不高。
时间序列分析属于概率统计学科的一个重要分支,近些年得到迅速发展,其实际应用遍及自然科学、社会科学以及工程技术的诸多领域。时间序列分析的若干理论已经相当成熟,特别是对于线性平稳时间序列,其多种模型己被广泛应用于各领域的控制和预测。
时间序列分析不通过其他变量对所观测时间序列{Xt}的行为做结构性解释分析,而是根据数据自身特点,为它建立一个能够反映时间序列过去行为的模型,以帮助我们预测未来行为。
我们把具有如下结构的模型称为自回归移动平均模型,简记为ARMA(p,q)。
xt=0+1xt-1+…+pxt-p+εt-θ1εt-1-…-θqεt-q
p≠0,θq≠0
E(εt)=0,Var(εt)=σ2ε,E(εtεs)=0,s≠t
Extεt=0,s<1
若0=0,则该模型被称为中心化ARMA(p,q)模型。缺省默认条件,中心化ARMA(p,q)模型可以简写为xt=1xt-1+…+pxt-p+εt-θ1εt-1-…-θqεt-q。
其中,{xt}为平稳的时间序列;
{εt}为白噪声序列;
1,2,…p,θ1,θ2,…θq为常数。
ARIMA(p,q)模型的实质就是差分运算与ARMA模型的组合。这说明任何非平稳序列只要通过适当阶数的差分实现差分后平稳,就可以对差分后序列进行ARMA模型拟合。
2使用时间序列模型建模
韶关市地处粤北山区,水资源年际变化大,年内分配不均,受气候、水文和地理条件的制约,在洪水期易产生山洪而枯水期又易出现旱灾。自建国以来,韶关市旱情较严重的年份有1955、1963、1977、1986、2004、2009年,尤其是2001~2004年的多年连旱对韶关市经济发展和人们的日常生活造成重大损失。
图1为1978~2012年浈江年径流量数据折线图。由图2可知,浈江历年年径流量稍有递增趋势,各阶的自相关和偏自相关系数有一定的规律性,大都取负值,而非在零值附近波动。因此,对原始序列进行一阶差分,对一阶差分后数据做出自相关和偏自相关系数图形。
图3显示一阶差分后数据自相关系数拖尾,偏自相关系数可以近似看成四阶截尾。因此,选择ARIMA(2,1,0),ARIMA(3,1,0),ARIMA(4,1,0)以及ARIMA(5,1,0)模型。综合比较模型参数,选择较优模型。模型参数见表1。BIC准则适用于样本数据较少的问题,目的是判断预测目标的发展过程与哪一随机过程最接近。具体的使用原则是在规定
范围内选择BIC值最小的模型。选择ARIMA(4,1,0)建立
模型,模型参数如表2所示。
用对信息的提取是否充分来判断模型的有效性,使用LjungBox检验统计量,判断法则为当检验统计量的P值大于显著性水平α时,认为残差是白噪声序列,否则说明残差
序列中还残留着相关信息,拟合模型不显著。由表1可知,
当使用ARIMA(4,1,0)模型建模时,其LjungBox统计量的显著性(α)为0.721,远大于显著性水平α(取α=0.05),可以认为残差是白噪声序列。进而,图4给出建立ARIMA(4,1,0)模型之后残差的自相关和偏自相关序列图,基本在零值附近波动,则模型有效。
当使用ARIMA(4,1,0)模型建模时,其模型参数见表2。参数检验结果显示,AR(1)、AR(2)、AR(3)、AR(4)系数均显著。使用ARIMA(4,1,0)模型对浈江2013~2016年年径流量进行预测,预测2013、2014、2015及2016年年径流量分别为51.46亿、58.88亿、6012亿以及63.09亿m3。其置信上限、置信下限见表3。把历年观察值数据、拟合值以及预测值曲线绘制到同一个坐标轴中,如图5所示。
3结论
通过对ARIMA模型理论的介绍和研究,对浈江年径流量建立多个ARIMA模型。按照一定的原则,选择较优的模型,并且对模型参数进行估计,对近4年的年径流量做预报分析。
水文预报的方法很多,然而对于中长期预报,目前还没有一种模型对所有的水文序列适用。预报模型的适用性至今仍是有待深入研究的問题。对于一个具体水文序列长期预报问题,往往通过对具体的数据进行分析、尝试、检验等步骤,最终找到较适合的预报模型。
参考文献
[1] 顾绮仪.长期水文统计预报方法在长江大通站径流预报中的应用[J].应用技术,2005,3(1):42-43.
[2] 蔡煜东,许伟杰.自组织人工神经网络在鄱阳湖年最高水位长期预报中的应用[J].水文科技情报,1993,10(2):27-29.
[3] 钟登华,王仁超,皮钧.水文预报时间序列神经网络模型[J].水利学报,1995(2):69-75.
[4] 张利平,王德智,夏军.白山水库径流中长期预报研究与应用[J].水电能源科学,2002(3):18-20.
[5] 陈守煜.中长期水文预报综合分析理论模式与方法[J].水利学报,1997(8):15-32.
[6] 白子岩.模糊模式识别法在中长期预报中的应用[J].水利水电技术,1999,30(2):50-51.
[7] 谢科范.评灰色系统理论[J].系统工程,1991,9(4):49-52.
[8] 夏军.灰色系统水文学理论方法及应用[M].武汉:华中理工大学出版社,1999:36-47.
[9] 洪时中.非线性时间序列分析的最新进展及其在地球科学中的应用前景[J].地球科学进展,1999,14(6):559.
[10] OOMS M,FRANSES P H.A seasonal periodic long memory model for monthly river flows[J].Environmental Modeling&Software,2001,16:559-569.
[11] 张小静.函数系数自回归模型在水文预报中的应用[D].西安:西安理工大学,2007.