论文部分内容阅读
摘 要:结合频谱时间序列的特点,选择ARIMA模型作为预测模型,通过ARIMA模型算法的流程分析,初步论证预测模型及预测精度的可靠性。
关键词:ARIMA模型频谱时间序列
中图分类号:TM714 文献标识码:A 文章编号:1674-098X(2011)05(c)-0014-01
时间序列就是按时间顺序取得的一系列观测值,具有如下特点:首先,时间序列的数据或数据点的位置依赖于时间,即数据的取值依赖于时间的变化,但不一定是时间t的严格函数;其次,每一时刻上的取值或数据点的位置具有一定的随机性,不可能完全准确地用历史值进行预测;第三,前后时刻(不一定是相邻时刻)的数值或数据点的位置有一定的相关性,这种相关性就是系统的动态规律性。
1 频谱时间序列的特点
由于电磁环境的复杂多样性以及许多未知因素和不确定因素的影响,频谱占用是一个复杂多变的过程,频谱数据具有高度的非线性特点。目前多数学者认为,频谱时间序列一般由确定分量和随机分量组成,确定分量具有一定的物理含义,随机分量由不规则的振荡和随机影响造成,具有高度的非线性特点,在进行频谱数据分析时,应根据频谱时间序列的特点找出一种精度較高的预测模型。
2 基于ARIMA模型算法的流程分析
ARIMA模型算法分析流程图如图1所示。
2.1 平稳性检验
平稳时间序列因为有很好的统计特性,首先检验所观测样本的平稳性,然后根据其是否具有平稳性来建立相适应的模型,主要使用自相关系数和自相关图检验。运用自相关分析图判定时间序列平稳性的一般准则是:若时间序列的自相关系数基本上(通常为p>3时)都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关系数更多的落在置信区间外面,则该时间序列就不具有平稳性。
2.2 纯随机性检验
如果序列值之间没有任何相依性,过去的行为对将来的发展没有任何丝毫影响,这种序列称为纯随机序列。从统计的观点来看,纯随机序列是没有任何分析价值的序列,因此需要对平稳序列进行纯随机性检验。
如果时间序列满足如下性质:
①任取t∈T,有
(7)
②任取t,s∈T,有
(8)
则称序列为纯随机序列,也称为白噪声(White Noise)序列,简记为 。
白噪声序列的各项之间没有任何相依性,没有记忆能力,完全进行无序的随机波动。如果序列值之间出现某种显著的相依关系:
(9)
就说明该序列不是纯随机序列,该序列间隔k期的序列值之间存在着一定程度的相互影响关系,统计上称为相关信息。分析的目的就是要想方设法把这种相关信息从观测值序列中充分提取出来。一旦观测值序列中蕴含的相关信息被充分提取出来了,那么剩下的残差序列就应该呈现出纯随机的性质,所以纯随机性也是判断相关信息是否被充分提取了的一个判断标准。
另外,白噪声序列的每个分量的方差都相等,也就是所谓方差齐性。在时间序列分析中,方差齐性是一个非常重要的限制条件。因为根据Markov定理,只有方差齐性假定成立时,我们用最小二乘法得到的未知参数估计值才是最佳的线性无偏估计。否则,最小二乘估计值就不是最佳的线性无偏估计,拟合模型的精度就会受很大的影响。所以在进行模型拟合时,就要检查拟合模型的残差是否满足方差齐性假定。如果不满足,那就说明残差序列还不是白噪声序列,即拟合模型还没有充分提取随机序列中的相关信息,这时就需要使用适当的条件异方模型来拟合该序列。
2.3 模型识别
ARMA模型的识别可以通过自相关系数、偏自相关系数图进行。自相关系数描述的是时间序列观测值与过去值之间的相关性。偏自相关系数(PACF,Partial Autocorrelation Function)则为在给定中间观测值的条件下,观测值与前面某个间隔的观测值之间的相关系数。偏自相关系数的推导过程较为复杂,其实质是使残差的方差达到最小的k阶AR模型的第k项系数。
利用相关系数图进行模型识别,还应该搞清楚截尾与拖尾的概念。所谓截尾,是指在相关系数图或偏自相关系数图中,自相关系数或偏自相关系数在滞后的前几期处于置信区间之外,而滞后的系数基本上都落入置信区间内,且逐渐趋于零。通常把相关系数图在滞后第p期后截尾的情况叫做p阶截尾。所谓拖尾,是指在自相关系数图或偏自相关系数图中的系数有指数型、正弦型或震荡型衰减的波动,并不会都落入置信区间内。利用自相关系数图或偏自相关系数图进行模型识别,主要依靠以下原则,如表1所示。
2.4 求预测效果
在建立ARIMA模型的基础上对频谱监测数据进行多步预测,并引入统计量均方根误差(RMSE)和正归化均方根误差(NRMSE)来评价模型的预测效果。
(17)
(18)
式中,,分别为实测值和预测值,为实测值的标准差,为预测步数。RMSE、NRMSE的值越小说明预测结果越好。
关键词:ARIMA模型频谱时间序列
中图分类号:TM714 文献标识码:A 文章编号:1674-098X(2011)05(c)-0014-01
时间序列就是按时间顺序取得的一系列观测值,具有如下特点:首先,时间序列的数据或数据点的位置依赖于时间,即数据的取值依赖于时间的变化,但不一定是时间t的严格函数;其次,每一时刻上的取值或数据点的位置具有一定的随机性,不可能完全准确地用历史值进行预测;第三,前后时刻(不一定是相邻时刻)的数值或数据点的位置有一定的相关性,这种相关性就是系统的动态规律性。
1 频谱时间序列的特点
由于电磁环境的复杂多样性以及许多未知因素和不确定因素的影响,频谱占用是一个复杂多变的过程,频谱数据具有高度的非线性特点。目前多数学者认为,频谱时间序列一般由确定分量和随机分量组成,确定分量具有一定的物理含义,随机分量由不规则的振荡和随机影响造成,具有高度的非线性特点,在进行频谱数据分析时,应根据频谱时间序列的特点找出一种精度較高的预测模型。
2 基于ARIMA模型算法的流程分析
ARIMA模型算法分析流程图如图1所示。
2.1 平稳性检验
平稳时间序列因为有很好的统计特性,首先检验所观测样本的平稳性,然后根据其是否具有平稳性来建立相适应的模型,主要使用自相关系数和自相关图检验。运用自相关分析图判定时间序列平稳性的一般准则是:若时间序列的自相关系数基本上(通常为p>3时)都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关系数更多的落在置信区间外面,则该时间序列就不具有平稳性。
2.2 纯随机性检验
如果序列值之间没有任何相依性,过去的行为对将来的发展没有任何丝毫影响,这种序列称为纯随机序列。从统计的观点来看,纯随机序列是没有任何分析价值的序列,因此需要对平稳序列进行纯随机性检验。
如果时间序列满足如下性质:
①任取t∈T,有
(7)
②任取t,s∈T,有
(8)
则称序列为纯随机序列,也称为白噪声(White Noise)序列,简记为 。
白噪声序列的各项之间没有任何相依性,没有记忆能力,完全进行无序的随机波动。如果序列值之间出现某种显著的相依关系:
(9)
就说明该序列不是纯随机序列,该序列间隔k期的序列值之间存在着一定程度的相互影响关系,统计上称为相关信息。分析的目的就是要想方设法把这种相关信息从观测值序列中充分提取出来。一旦观测值序列中蕴含的相关信息被充分提取出来了,那么剩下的残差序列就应该呈现出纯随机的性质,所以纯随机性也是判断相关信息是否被充分提取了的一个判断标准。
另外,白噪声序列的每个分量的方差都相等,也就是所谓方差齐性。在时间序列分析中,方差齐性是一个非常重要的限制条件。因为根据Markov定理,只有方差齐性假定成立时,我们用最小二乘法得到的未知参数估计值才是最佳的线性无偏估计。否则,最小二乘估计值就不是最佳的线性无偏估计,拟合模型的精度就会受很大的影响。所以在进行模型拟合时,就要检查拟合模型的残差是否满足方差齐性假定。如果不满足,那就说明残差序列还不是白噪声序列,即拟合模型还没有充分提取随机序列中的相关信息,这时就需要使用适当的条件异方模型来拟合该序列。
2.3 模型识别
ARMA模型的识别可以通过自相关系数、偏自相关系数图进行。自相关系数描述的是时间序列观测值与过去值之间的相关性。偏自相关系数(PACF,Partial Autocorrelation Function)则为在给定中间观测值的条件下,观测值与前面某个间隔的观测值之间的相关系数。偏自相关系数的推导过程较为复杂,其实质是使残差的方差达到最小的k阶AR模型的第k项系数。
利用相关系数图进行模型识别,还应该搞清楚截尾与拖尾的概念。所谓截尾,是指在相关系数图或偏自相关系数图中,自相关系数或偏自相关系数在滞后的前几期处于置信区间之外,而滞后的系数基本上都落入置信区间内,且逐渐趋于零。通常把相关系数图在滞后第p期后截尾的情况叫做p阶截尾。所谓拖尾,是指在自相关系数图或偏自相关系数图中的系数有指数型、正弦型或震荡型衰减的波动,并不会都落入置信区间内。利用自相关系数图或偏自相关系数图进行模型识别,主要依靠以下原则,如表1所示。
2.4 求预测效果
在建立ARIMA模型的基础上对频谱监测数据进行多步预测,并引入统计量均方根误差(RMSE)和正归化均方根误差(NRMSE)来评价模型的预测效果。
(17)
(18)
式中,,分别为实测值和预测值,为实测值的标准差,为预测步数。RMSE、NRMSE的值越小说明预测结果越好。