论文部分内容阅读
摘 要:本文采用来自国家统计局1992年以来的全国生产总值季度数据,运用时间序列分析的有关方法,分别对1992年至2018年的全国生产总值季度数据建立了混合分解模式+误差自回归组合模型和X-11模型,并用2019年四个季度和2020年前三个季度的数据验证与对比两个模型的预测效果,最终确定了混合分解模式+误差自回归组合模型为预测我国GDP季度数据的良好模型。最后,本文用该模型对我国2020年最后一个季度以及2021年的GDP季度数据进行预测。
关键词:GDP季度序列;混合分解式;误差自回归;组合模型;X-11模型
一、引言
国内生产总值(Gross Domestic Product,GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被认为是衡量国家经济状况的最佳指标。国内生产总值对于判断经济态势运行、衡量经济综合实力、正确制定经济政策等诸多方面均起着不可替代的作用。自1985年以来,国内生产总值的核算已经成为我国经济管理部门了解经济运行状况的重要手段和制定经济发展战略、规划、年度计划以及各种宏观经济政策的重要依据。因此,深入研究并建立国内生产总值发展规律模型具有重要的现实意义。
近年来,国内外有一些学者运用时间序列分析的方法研究了GDP的发展规律并对其未来的发展情况进行了预测。魏宁、边宽江等通过SPSS分析1952-2007年陕西省的GDP数据,并预测了陜西省2008-2013年的GDP分布情况。靳珊运用Eviews软件分析了1950-2006年贵州的GDP数据,通过建立ARIMA(1,1,1)模型以揭示贵州GDP的增长变化规律。丁文斌对比分析了回归模型和时间序列模型,发现利用回归模型进行预测在实际中应用较多,但建模过程中的一些要求和假设条件使人们在实际的操作中受到很大的限制。戴羽等又利用另一种方法GM(1,1)模型对安徽省GDP总量进行了预测,具有较高的精度。
通过对以前学者的研究文献进行分析,我们总结出了三个主要的问题:一是绝大多数对GDP进行时间序列分析的文献都是对GDP的长期经济规律进行研究,很少有文献对其短期季节波动及预测作更加深入的分析;二是大多数文献都是用SARIMA模型研究GDP的变化规律,很少有文献建立其他时序模型研究GDP随时间的发展状况;三是对GDP数据进行分析的工具较为单一,多采用SPSS软件进行分析,很少应用具备更优准确性与优越性的SAS软件对其进行研究。
基于以上分析,本文采用来自国家统计局1992年-2018年的GDP季度数据,应用较为权威的SAS软件,通过建立混合分解模式+误差自回归组合模型和X-11模型,对中国GDP季度数据进行分析,并应用混合分解模式+误差自回归组合模型对我国2020年-2021年的GDP季度数据进行短期预测,以从宏观上了解中国经济的发展状况。
本文共分为四章,全文结构如下:
第一章为引言。为了给读者一个整体的印象,本章对本文的实际背景、研究内容、经济意义、选取的模型方法等给出综述性的介绍。
第二章介绍了混合分解模式+误差自回归组合模型和X-11模型的基本思想、建模步骤。
第三章是全文的主体,详细介绍了混合分解模式+误差自回归组合模型和X-11模型的整个研究过程及应用。本章选取1992年-2018年中国国民生产总值的季度数据,分别建立混合分解模式+误差自回归组合模型和X-11模型来拟合该序列的发展,并用SAS软件检验模型的可行性,评价模型的拟合效果后选择最佳模型进行预测应用。
第四章是总结性评论分析,对混合分解模式+误差自回归组合模型在GDP季度数据预测问题上的使用效果作出一定的评价。
二、理论基础
1.混合分解模式+误差自回归组合模型
混合分解模式+误差自回归组合模型的基本思想为:任何一个时间序列都可以分解为一个确定性的趋势成分(含增减趋势、季节趋势)和平稳零均值的随机成分;而趋势成分则可以通过趋势分析方法、季节效用分析方法分解出增减趋势和季节趋势(也称周期性趋势);平稳的随机成分可以用ARMA模型来描述其规律。本文所涉及的混合分解式的基本形式为:
Xt=St(Tt+It) (1)
其中,季节部分(St)可以通过计算季节指数的方法得到季节趋势的模型;趋势部分(Tt)可以利用线性拟合、非线性拟合、移动平均法、指数平滑法等方法得到(增减)趋势的模型;随机部分(It)的模型可以通过AR模型、MA模型或ARMA模型来描述。
因此,混合分解模式+误差自回归组合模型的具体形式为:
2.X-11模型
X-11模型的基本原理为时间序列的确定性因素分解方法。X-11模型将时序的因素分解为:长期趋势起伏T、季节波动S、不规则波动I以及交易日影响D。X-11模型的随机波动部分通过多次短期中心移动平均来消除,趋势部分用周期移动平均来消除,交易日影响通过交易周期移动平均来消除。
X-11模型分为加法模型和乘法模型两种。其中,加法模型的一般形式为:Xt=Tt+St+Dt+It,乘法模型的一般形式为:Xt=TtStDtIt。本文主要使用乘法模型对GDP季度数据进行拟合,其基本步骤为:
(1)先使用移动平均法对原始序列的趋势
进行估计;
(2)从原始序列Xt中剔除
得到季节和不规则波动的相对数:(StIt)=Xt/
;
(3)再利用移动平均法对(StIt)进行季节调整,得到季节成分
;
(4)再得到不规则变动 ;
(5)多次迭代。
三、实证研究
1.数据选取
本文引用的是全国生产总值的季度数据:1992年第一季度至2020年第三季度,来源于国家统计局。
为了在训练过程中对模型的准确性进行检验,本文取后7个为测试集,其余则为训练集。
2.模型构建与评估
(1)模型构建
①混合分解模式+误差自回归组合模型
使用训练集数据,通过序列图进行增长趋势和季节趋势的判定之后,分别对季节效应、趋势效应和随机波动进行拟合,并对最终模型进行残差自相关检验。经检验DW值基本接近于2,说明最终模型的残差基本不存在相关性,模型对于序列信息的提取相对来说是比较充分的。因此,最终构建的混合分解模式+误差自回归组合模型为:
②X-11模型
根据X-11模型建模的基本步骤,编写并运行SAS程序,可以得到拟合值和预测值的时序图如图1所示。
③模型评估
本文以均方根误差RMSE和平均绝对误差百分率MAPE作为评价拟合预测效果的标准。RMSE侧重衡量偏差,MAPE侧重衡量模型稳健性。
n为样本数,
为真实值,
为预测值。
用构建的混合分解模式+误差自回归组合模型和X-11模型预测后7个数据,对比原数据与预测数据并计算相应的RMSE和MAPE,结果如下:
由RMSE可知组合模型与X-11模型的预测精度都是极高的;但是,由MAPE的值可以看出组合模型相比于X-11模型具有更强的稳健性。因此,我们可以确定混合分解模式+误差自回归组合模型为预测我国GDP季度数据的良好模型。
3.GDP季度数据的预测
根据模型评估结果可知,混合分解模式+误差自回归组合模型为预测我国GDP季度数据的良好模型。因此,本文根据1992年第一季度至2020年第三季度的GDP数据建立模型,运用模型预测中国未来五个季度的GDP数据,结果如下:
四、分析与结论
1.关于模型运用
通过比较预测值和真实值,我们可以看出在对国内生产总值季度数据的预测中混合分解模式+误差自回归组合模型预测误差很小,預测精度很高。但这种预测精度随着时间跨度的增加可能会有所降低,且模型对于外界突发因素影响时反应能力不是很强。这可能是大多数时间序列模型的一大弊端。因此,从短期来看,混合分解模式+误差自回归组合模型对国内生产总值季度数据未来几年的预测具有一定的可信度和实用性,政府可以利用混合分解模式+误差自回归组合模型对中国未来的GDP季度数据进行预测,以提前了解宏观经济的状况,据此制定相应的政策,促进经济的良好健康发展。
2.关于预测结果
从对2020年第四季度至2021年第四季度GDP的预测结果可知,国内生产总值仍然延续以往的发展规律。由2020年第四季度达到2020年的最高峰之后,到2021年的第一季度又急速下降,2021年第一季度达到这一年中国内生产总值的最小值,之后每个季度的GDP都是呈现增长趋势,到2021年第四季度又达到最高峰。GDP一年中的这种发展规律是与人们平时的消费习惯以及中国传统节日的时间点是有较大联系的。每年的第一季度包含了中国人休假过春节的时点,因此这个季度的GDP最低,而春节后逐渐恢复生产,使得GDP随着季节的推移呈现增长的趋势。从第四季度开始,既有对商品进行大促销的“双十一”活动,又有人们办年货准备过年而加大消费,因此每年的第四季度达到国内生产总值的最高峰。
从图2还可以看出,我国GDP的增长幅度是逐年上升的,这与中国国力的日益强盛,经济发展的日益迅速是息息相关的。图2中在2020年第一季度的数据是一个突出的点,这个点的异常突出可见2020年年初新冠疫情的席卷给我国经济带来的巨大打击。从国内生产总值来看,新冠疫情使得我国GDP出现了一个较大的下滑,但到第二季度之后又逐渐恢复到正常水平,足见我国在经济方面应对新冠疫情冲击时反应很迅速,对新冠疫情后经济的振兴与调整也很及时。
参考文献:
[1]王莎莎,陈安,苏静,李硕.组合预测模型在中国GDP预测中的应用[J].山东大学学报(理学版),2009,44(02):56-59.
[2]魏宁,边宽江,袁志发.基于ARIMA模型的陕西省GDP分析与预测[J].安徽农业科学,2010,38(09):4933-4935.
[3]靳珊.ARIMA模型在贵州GDP中的应用[J].科教文汇(中旬刊),2007(10):154-155.
[4]丁文斌.GDP总量预测方法探讨研究[J].统计与预测,2003(06):57-59.
[5]戴羽,王媛媛,王伦夫.基于灰色GM(1,1)模型的安徽省GDP总量预测[J].重庆工学院学报(自然科学版),2008(02):74-77+153.
[6]王燕.应用时间序列分析[M].中国人民大学出版社,2005:167- 171,170-172.
[7]国家统计局:http://www.stats.gov.cn/.
[8]陈佳珊,张丹.基于SARIMA组合模型的农产品生产价格指数的短期预测[J].时代金融,2019(30):56-57.
作者简介:陈泳冰(2000.01- ),汉族,广东揭阳人,本科在读,就读于华南师范大学应用统计学专业
关键词:GDP季度序列;混合分解式;误差自回归;组合模型;X-11模型
一、引言
国内生产总值(Gross Domestic Product,GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被认为是衡量国家经济状况的最佳指标。国内生产总值对于判断经济态势运行、衡量经济综合实力、正确制定经济政策等诸多方面均起着不可替代的作用。自1985年以来,国内生产总值的核算已经成为我国经济管理部门了解经济运行状况的重要手段和制定经济发展战略、规划、年度计划以及各种宏观经济政策的重要依据。因此,深入研究并建立国内生产总值发展规律模型具有重要的现实意义。
近年来,国内外有一些学者运用时间序列分析的方法研究了GDP的发展规律并对其未来的发展情况进行了预测。魏宁、边宽江等通过SPSS分析1952-2007年陕西省的GDP数据,并预测了陜西省2008-2013年的GDP分布情况。靳珊运用Eviews软件分析了1950-2006年贵州的GDP数据,通过建立ARIMA(1,1,1)模型以揭示贵州GDP的增长变化规律。丁文斌对比分析了回归模型和时间序列模型,发现利用回归模型进行预测在实际中应用较多,但建模过程中的一些要求和假设条件使人们在实际的操作中受到很大的限制。戴羽等又利用另一种方法GM(1,1)模型对安徽省GDP总量进行了预测,具有较高的精度。
通过对以前学者的研究文献进行分析,我们总结出了三个主要的问题:一是绝大多数对GDP进行时间序列分析的文献都是对GDP的长期经济规律进行研究,很少有文献对其短期季节波动及预测作更加深入的分析;二是大多数文献都是用SARIMA模型研究GDP的变化规律,很少有文献建立其他时序模型研究GDP随时间的发展状况;三是对GDP数据进行分析的工具较为单一,多采用SPSS软件进行分析,很少应用具备更优准确性与优越性的SAS软件对其进行研究。
基于以上分析,本文采用来自国家统计局1992年-2018年的GDP季度数据,应用较为权威的SAS软件,通过建立混合分解模式+误差自回归组合模型和X-11模型,对中国GDP季度数据进行分析,并应用混合分解模式+误差自回归组合模型对我国2020年-2021年的GDP季度数据进行短期预测,以从宏观上了解中国经济的发展状况。
本文共分为四章,全文结构如下:
第一章为引言。为了给读者一个整体的印象,本章对本文的实际背景、研究内容、经济意义、选取的模型方法等给出综述性的介绍。
第二章介绍了混合分解模式+误差自回归组合模型和X-11模型的基本思想、建模步骤。
第三章是全文的主体,详细介绍了混合分解模式+误差自回归组合模型和X-11模型的整个研究过程及应用。本章选取1992年-2018年中国国民生产总值的季度数据,分别建立混合分解模式+误差自回归组合模型和X-11模型来拟合该序列的发展,并用SAS软件检验模型的可行性,评价模型的拟合效果后选择最佳模型进行预测应用。
第四章是总结性评论分析,对混合分解模式+误差自回归组合模型在GDP季度数据预测问题上的使用效果作出一定的评价。
二、理论基础
1.混合分解模式+误差自回归组合模型
混合分解模式+误差自回归组合模型的基本思想为:任何一个时间序列都可以分解为一个确定性的趋势成分(含增减趋势、季节趋势)和平稳零均值的随机成分;而趋势成分则可以通过趋势分析方法、季节效用分析方法分解出增减趋势和季节趋势(也称周期性趋势);平稳的随机成分可以用ARMA模型来描述其规律。本文所涉及的混合分解式的基本形式为:
Xt=St(Tt+It) (1)
其中,季节部分(St)可以通过计算季节指数的方法得到季节趋势的模型;趋势部分(Tt)可以利用线性拟合、非线性拟合、移动平均法、指数平滑法等方法得到(增减)趋势的模型;随机部分(It)的模型可以通过AR模型、MA模型或ARMA模型来描述。
因此,混合分解模式+误差自回归组合模型的具体形式为:
2.X-11模型
X-11模型的基本原理为时间序列的确定性因素分解方法。X-11模型将时序的因素分解为:长期趋势起伏T、季节波动S、不规则波动I以及交易日影响D。X-11模型的随机波动部分通过多次短期中心移动平均来消除,趋势部分用周期移动平均来消除,交易日影响通过交易周期移动平均来消除。
X-11模型分为加法模型和乘法模型两种。其中,加法模型的一般形式为:Xt=Tt+St+Dt+It,乘法模型的一般形式为:Xt=TtStDtIt。本文主要使用乘法模型对GDP季度数据进行拟合,其基本步骤为:
(1)先使用移动平均法对原始序列的趋势
进行估计;
(2)从原始序列Xt中剔除
得到季节和不规则波动的相对数:(StIt)=Xt/
;
(3)再利用移动平均法对(StIt)进行季节调整,得到季节成分
;
(4)再得到不规则变动 ;
(5)多次迭代。
三、实证研究
1.数据选取
本文引用的是全国生产总值的季度数据:1992年第一季度至2020年第三季度,来源于国家统计局。
为了在训练过程中对模型的准确性进行检验,本文取后7个为测试集,其余则为训练集。
2.模型构建与评估
(1)模型构建
①混合分解模式+误差自回归组合模型
使用训练集数据,通过序列图进行增长趋势和季节趋势的判定之后,分别对季节效应、趋势效应和随机波动进行拟合,并对最终模型进行残差自相关检验。经检验DW值基本接近于2,说明最终模型的残差基本不存在相关性,模型对于序列信息的提取相对来说是比较充分的。因此,最终构建的混合分解模式+误差自回归组合模型为:
②X-11模型
根据X-11模型建模的基本步骤,编写并运行SAS程序,可以得到拟合值和预测值的时序图如图1所示。
③模型评估
本文以均方根误差RMSE和平均绝对误差百分率MAPE作为评价拟合预测效果的标准。RMSE侧重衡量偏差,MAPE侧重衡量模型稳健性。
n为样本数,
为真实值,
为预测值。
用构建的混合分解模式+误差自回归组合模型和X-11模型预测后7个数据,对比原数据与预测数据并计算相应的RMSE和MAPE,结果如下:
由RMSE可知组合模型与X-11模型的预测精度都是极高的;但是,由MAPE的值可以看出组合模型相比于X-11模型具有更强的稳健性。因此,我们可以确定混合分解模式+误差自回归组合模型为预测我国GDP季度数据的良好模型。
3.GDP季度数据的预测
根据模型评估结果可知,混合分解模式+误差自回归组合模型为预测我国GDP季度数据的良好模型。因此,本文根据1992年第一季度至2020年第三季度的GDP数据建立模型,运用模型预测中国未来五个季度的GDP数据,结果如下:
四、分析与结论
1.关于模型运用
通过比较预测值和真实值,我们可以看出在对国内生产总值季度数据的预测中混合分解模式+误差自回归组合模型预测误差很小,預测精度很高。但这种预测精度随着时间跨度的增加可能会有所降低,且模型对于外界突发因素影响时反应能力不是很强。这可能是大多数时间序列模型的一大弊端。因此,从短期来看,混合分解模式+误差自回归组合模型对国内生产总值季度数据未来几年的预测具有一定的可信度和实用性,政府可以利用混合分解模式+误差自回归组合模型对中国未来的GDP季度数据进行预测,以提前了解宏观经济的状况,据此制定相应的政策,促进经济的良好健康发展。
2.关于预测结果
从对2020年第四季度至2021年第四季度GDP的预测结果可知,国内生产总值仍然延续以往的发展规律。由2020年第四季度达到2020年的最高峰之后,到2021年的第一季度又急速下降,2021年第一季度达到这一年中国内生产总值的最小值,之后每个季度的GDP都是呈现增长趋势,到2021年第四季度又达到最高峰。GDP一年中的这种发展规律是与人们平时的消费习惯以及中国传统节日的时间点是有较大联系的。每年的第一季度包含了中国人休假过春节的时点,因此这个季度的GDP最低,而春节后逐渐恢复生产,使得GDP随着季节的推移呈现增长的趋势。从第四季度开始,既有对商品进行大促销的“双十一”活动,又有人们办年货准备过年而加大消费,因此每年的第四季度达到国内生产总值的最高峰。
从图2还可以看出,我国GDP的增长幅度是逐年上升的,这与中国国力的日益强盛,经济发展的日益迅速是息息相关的。图2中在2020年第一季度的数据是一个突出的点,这个点的异常突出可见2020年年初新冠疫情的席卷给我国经济带来的巨大打击。从国内生产总值来看,新冠疫情使得我国GDP出现了一个较大的下滑,但到第二季度之后又逐渐恢复到正常水平,足见我国在经济方面应对新冠疫情冲击时反应很迅速,对新冠疫情后经济的振兴与调整也很及时。
参考文献:
[1]王莎莎,陈安,苏静,李硕.组合预测模型在中国GDP预测中的应用[J].山东大学学报(理学版),2009,44(02):56-59.
[2]魏宁,边宽江,袁志发.基于ARIMA模型的陕西省GDP分析与预测[J].安徽农业科学,2010,38(09):4933-4935.
[3]靳珊.ARIMA模型在贵州GDP中的应用[J].科教文汇(中旬刊),2007(10):154-155.
[4]丁文斌.GDP总量预测方法探讨研究[J].统计与预测,2003(06):57-59.
[5]戴羽,王媛媛,王伦夫.基于灰色GM(1,1)模型的安徽省GDP总量预测[J].重庆工学院学报(自然科学版),2008(02):74-77+153.
[6]王燕.应用时间序列分析[M].中国人民大学出版社,2005:167- 171,170-172.
[7]国家统计局:http://www.stats.gov.cn/.
[8]陈佳珊,张丹.基于SARIMA组合模型的农产品生产价格指数的短期预测[J].时代金融,2019(30):56-57.
作者简介:陈泳冰(2000.01- ),汉族,广东揭阳人,本科在读,就读于华南师范大学应用统计学专业