论文部分内容阅读
近年来我国学者对于时间序列的研究取得了极其丰硕的成果,主要体现在基础理论研究的不断加强,某些领域已经达到了国际前沿水平,而不再只是纯粹的吸收引进国外的先进成果。时间序列分析在理论上的进展主要表现在两个方面:一是单位根理论,一是非线性模型理论。由于现代计算能力的进步和计算复杂程度的需要,人们开始探索数据的深层结构并且致力于减少传统参数模型的偏差,这种数据分析方法也称为非参数技术。
目前的各时间序列模型都是以假设数据服从某一模型或者接近某一模型这些前提下来建立和研究的。事实上,大多数情况下我们不可能知道一批数据到底服从什么分布,甚至不知道哪个模型能更接近于它。要建立一个比较准确的模型,必须要以足够的信息量为前提。目前常用的办法是先列出那些可能的模型,并将各模型一一求解,然后以某些判断准则来判断哪个模型拟合程度更好。由于不可能考虑到全部模型,而各判断准则也无法统一,很难真正确定一个合适的模型。本文的主旨在于找一个通用的模型,使在没有其他可用信息的情况下也能对数据的模型进行估计。
本文使用非参数方法建立模型,先以每一组数据出现的频率为应变量做出累积分布函数,再利用核函数将其连续化使之成为数据联合密度函数的估计。然后分析此估计的性质,并证明了此估计在数据量非常大的时候收敛于被光滑化后的联合密度函数。因此,这个模型可以被认为是满足我们条件的时间序列通用模型。
此非参数时间序列模型是一个非常广义的时间序列模型,其拥有假设条件少、适用范围大等优点。相比其他模型,此模型因为其以联合分布函数为估计对象,以非参数统计为指导思想,所以特别适用于残差的分布不相同且未知的情况。但相比其他模型,其劣势在于由于其假设条件少,所以对数据量的要求非常高,要建立本文中的非参数时间序列模型,必须要非常大量的数据。同时由于需要面对庞大的数据和在建立模型的过程中的对数据空间的细分,导致建立模型需要非常大的计算量。