论文部分内容阅读
【摘要】本文针对1963年至2012年全国工业事故死亡率,用ARMA模型进行时间序列分析,结合SAS软件检验模型的可行性,并进行预测应用。结果表明,基于ARMA模型的中国工伤事故死亡率的模拟值和真实值较吻合。
【关键词】ARMA模型;工伤事故;时间序列;预测
1.引言
本文试图通过对30年来全国安全生产历史数据的分析、拟合,并进行短期预测,从而为正确判断未来安全生产形势,制订相应措施提供可靠依据。
2.理论方法与数据来源
2.1 ARMA模型预测方法
ARMA模型是一种比较成熟的模型,适于短期预测。模型建立,要求时间序列是随机和平稳的,而且需要长期连续数据,编写程序进行模型的辨识。
2.1.1 AR模型
AR模型也称为自回归模型,它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测。自回归模型的数学公式为:
2.1.2 MA模型
MA模型也称为滑动平均模型,它的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测。滑动平均模型的数学公式为:
2.1.3 ARMA模型
自回归模型和滑动平均模型的组合,便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA。数学公式为:
2.1.4 ARMA模型的预测步骤
(a)对时间序列进行差分,以得到一个平稳随机序列,然后O一1均值化序列。
(b)计算差分后序列的自相关系数和偏相关系数,以选择一个合适的ARMA模型。
(c)用最小二乘法对ARMA模型分析,计算模型参数值。
(d)对估计得到的模型,进行适应性检验,重新改进模型,直至得到最优模型为止。
(e)进行预测。
2.2 数据来源
1983年至2012年中国工业企业事故死亡人数、职工人数来源于《安全生产年鉴》、《中国统计年鉴》和《中国劳动统计年鉴》等正式出版物。以1983-2012年全国工业企业事故死亡人数、死亡率作为建模基础数据,如表l所示:
3.结果分析
先对原始数据进行初步分析,通过绘制数据趋势图检验时间序列。可以发现,2O世纪8O年代初到90年代初,工伤死亡人数略呈平稳下降,然后明显上升。1996年后逐渐下降,2000年又出现上升趋势。但死亡率除个别年代出现波动外,总体上是呈下降趋势,时间序列为非平稳序列。由于ARMA模型只能分析0-1均值化的时间序列,而计算出序列的均值为0.045,表明对序列的影响很小,故忽略不计,认为数据是均值化的。根据ARMA模型的自相关和偏相关分析法编写程序,识别模型的阶数。相关系数和偏相关系数分析如表2所示。
经过自相关分析图分析,的取值范围在置信区间[-2.59,2.59]内,可见序列是一随机列,而且当k>3时,在零值附近上下波动,可见序列是一平稳序列当>2时,取值都在[-2.59,2.59]内,且有收敛到零的趋势,根据定阶准则,证明符合AR(2)模型。
模型参数的估计使用最小二乘法.用统计软件SAS分析,结果如下:,F值为7.05,远远大于F0.01(2,43),所以回归是高度显著的.分析表明AR(2)是合适的。
4.结束语
从本研究的具体估计结果来看.多数年份相对误差在10%以下,说明此方法预测比较精确,短期预测可信度较高。而2000年以来有所上升.这与我国经济发展正处于快速发展上升周期,不断加大的能源需求,而安全生产投人相对滞后等因素有较大关系。
参考文献
[1]徐国祥.统计预测和决策[M].上海财经大学出版社,2006.
[2]王振龙.时间序列分析[M].中国统计出版社,2003.
【关键词】ARMA模型;工伤事故;时间序列;预测
1.引言
本文试图通过对30年来全国安全生产历史数据的分析、拟合,并进行短期预测,从而为正确判断未来安全生产形势,制订相应措施提供可靠依据。
2.理论方法与数据来源
2.1 ARMA模型预测方法
ARMA模型是一种比较成熟的模型,适于短期预测。模型建立,要求时间序列是随机和平稳的,而且需要长期连续数据,编写程序进行模型的辨识。
2.1.1 AR模型
AR模型也称为自回归模型,它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测。自回归模型的数学公式为:
2.1.2 MA模型
MA模型也称为滑动平均模型,它的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测。滑动平均模型的数学公式为:
2.1.3 ARMA模型
自回归模型和滑动平均模型的组合,便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA。数学公式为:
2.1.4 ARMA模型的预测步骤
(a)对时间序列进行差分,以得到一个平稳随机序列,然后O一1均值化序列。
(b)计算差分后序列的自相关系数和偏相关系数,以选择一个合适的ARMA模型。
(c)用最小二乘法对ARMA模型分析,计算模型参数值。
(d)对估计得到的模型,进行适应性检验,重新改进模型,直至得到最优模型为止。
(e)进行预测。
2.2 数据来源
1983年至2012年中国工业企业事故死亡人数、职工人数来源于《安全生产年鉴》、《中国统计年鉴》和《中国劳动统计年鉴》等正式出版物。以1983-2012年全国工业企业事故死亡人数、死亡率作为建模基础数据,如表l所示:
3.结果分析
先对原始数据进行初步分析,通过绘制数据趋势图检验时间序列。可以发现,2O世纪8O年代初到90年代初,工伤死亡人数略呈平稳下降,然后明显上升。1996年后逐渐下降,2000年又出现上升趋势。但死亡率除个别年代出现波动外,总体上是呈下降趋势,时间序列为非平稳序列。由于ARMA模型只能分析0-1均值化的时间序列,而计算出序列的均值为0.045,表明对序列的影响很小,故忽略不计,认为数据是均值化的。根据ARMA模型的自相关和偏相关分析法编写程序,识别模型的阶数。相关系数和偏相关系数分析如表2所示。
经过自相关分析图分析,的取值范围在置信区间[-2.59,2.59]内,可见序列是一随机列,而且当k>3时,在零值附近上下波动,可见序列是一平稳序列当>2时,取值都在[-2.59,2.59]内,且有收敛到零的趋势,根据定阶准则,证明符合AR(2)模型。
模型参数的估计使用最小二乘法.用统计软件SAS分析,结果如下:,F值为7.05,远远大于F0.01(2,43),所以回归是高度显著的.分析表明AR(2)是合适的。
4.结束语
从本研究的具体估计结果来看.多数年份相对误差在10%以下,说明此方法预测比较精确,短期预测可信度较高。而2000年以来有所上升.这与我国经济发展正处于快速发展上升周期,不断加大的能源需求,而安全生产投人相对滞后等因素有较大关系。
参考文献
[1]徐国祥.统计预测和决策[M].上海财经大学出版社,2006.
[2]王振龙.时间序列分析[M].中国统计出版社,2003.