论文部分内容阅读
随着现代信息技术的发展,在日常的商业运作中积累大量关于时间序列的数据,这些数据中蕴含了大量的商业信息,需要我们进行挖掘.孤立点的挖掘是其重要的一个内容.在传统的观念中,孤立点常常被认为是噪声数据或无用数据,分析时一般的方法是排除这些干扰数据.然而,一个对象的噪声可能是另一个对象的信号,这种处理方法可能导致重要的隐藏信息的丢失.目前,在时间序列分析领域,孤立点的挖掘越来越多的受到重视.Box和TiaoAbraham(1972)、Barnett和Lewis(1984)、ChungChen和Lon-MuLiu(1993)、Diaz(1991)、MocullochTsay(1994)、CathyW.S(1997)都在这一方面做了一些有重要影响的工作.但他们的工作主要集中在这两点:(1)对数据进行孤立点的挖掘主要目的是为了更好的估计模型的参数,所采用的方法是删除这些孤立点,未考虑孤立点本身所蕴含的价值;(2)所考虑的模型主要是AR(p)模型,或将一个ARMA(p,q)模型转化为AR(p+q)模型.Lon-MULiu.et(2001)在快餐行业的数据中进行了实例分析,真正考虑了孤立点所蕴含的商业价值.本文将在前人的基础上,着眼于含AO型孤立点的ARMA模型进行挖掘工作,目的是挖掘出孤立点所蕴含的重要信息.首先介绍了一般的孤立点的探测方法,然后从贝叶斯的观点,提出了利用Gibbs抽样方法挖掘ARMA模型序列中的AO型孤立点;针对序列中可能存在的多个连续的孤立点,提出了对算法的改进,并对其进行了模拟试验.最后,本文将所提出的方法应用到两个具体的实例,取得了较好的效果.