论文部分内容阅读
在传统的统计分析中,一般把数据看成是有限的离散点,是单个观测值的顺序排列,所选取的数据一般来自时间序列、截面数据、纵向数据等不同的数据结构,针对不同的数据结构都有与其相匹配的统计方法进行研究。但如今随着信息技术的发展,人们获取和存储数据的能力得到了极大的提高,大量形式各异的复杂型数据不断涌现,例如高频数据、缺失数据、流式数据、曲线、曲面以及图像等无限维数据,这些数据往往呈现出某种函数的特性,因此越来越多的数据可以用函数型数据的形式表示。由于传统的统计分析方法通常依赖过多的假设条件,往往不适用于分析这种复杂的数据类型,因此,函数型数据分析方法作为一种新的研究方法随之产生。 函数型数据分析(Functional Data Analysis,FDA)是从函数的角度对数据进行分析,把函数型观测数据(χi=(χi1,χi2,…,χiT))看成一个整体,表示为光滑曲线或连续函数xi(t),i=1,…,N,其中N表示观测对象曲线的个数,t可以表示时间,当然也可以表示时间以外的其它变量,这里的“函数”是指数据的内在结构,而不是数据的外在形式。函数型数据分析方法开始关注无限维数据,并较少的依赖假设条件,从函数的角度进行数据分析,能够更多的挖掘出数据的隐含信息。因此,函数型数据分析方法近年来得到了较快的发展,已经成为统计学领域研究的热点问题之一。 目前,关于函数型数据分析方法的研究成果不断涌现,国外学者对函数型多元统计分析、函数型线性模型等理论方面均取得了较好的研究成果;此外,该理论被应用于医学、生物学、环境计量学、化学计量学等诸多领域。但函数型数据分析目前仍处于起步阶段,理论方面还存在很多的问题需要改进和完善,还应继续推广该方法的应用领域,如在经济、金融等方面的应用。目前,我国对函数型数据分析方法的研究还处于初步学习阶段,国内学者基本是针对函数型数据分析的基本思想做综述性的研究,或是在一些理论基础上做一些简单的应用,因此,对函数型数据分析理论及应用的研究具有创新性和挑战性。 本文尝试从函数型线性回归模型及其拓展和函数型时间序列预测模型这两个大的方面对函数型数据分析方法的理论进行探讨,并将理论应用于研究经济领域的实际问题中。研究方法上,采用传统回归分析、计量经济分析、多元统计分析、函数型数据分析、非参数统计、随机过程等多种理论方法相结合,对所研究模型进行理论推导,并与实证分析相结合对实际经济问题进行研究,实证结果表明函数型数据分析方法较之其他的统计方法有更多的优越性。 全文共有六章内容:第一章为引言,介绍了选题背景及选题意义,对函数型数据分析的研究现状做了综述,阐述了本文的主要研究内容与创新之处;第二章从整体上对函数型数据分析方法进行了概述;第三章讨论了函数型线性模型及其扩展;第四章讨论了基于广义可加模型的函数型投影寻踪回归模型;第五章讨论了函数型自回归预测模型;第六章总结了本文的研究成果,并对未来进一步研究的内容做出了展望。 第一章为本文的引言部分。首先介绍了选题背景及选题意义;其次从函数型主成分分析研究、函数型线性模型研究、函数型时间序列分析研究三方面对函数型数据分析方法的研究现状进行了综述;最后阐述了本文的研究内容和创新之处。 第二章从整体上对函数型数据分析方法进行了概述。首先介绍了函数型数据的基本特征,比较了FDA方法与传统统计分析方法的不同,给出了FDA方法的优点;其次分析了函数型数据分析的基本目的和步骤,给出了对函数型数据进行预处理的基本方法;最后介绍了传统的主成分分析和函数型主成分分析。 第三章首先从传统回归模型研究做起,对线性模型的一种有偏估计c-(K,S)型估计进行研究,得出了c-(K,S)型估计在MSEM准则下的优良性,给出了MSEM准则下估计量相对效率的界,并证明了c-(K,S)型估计的可容许性,此理论对线性模型多重共线性的改进起到了积极作用,而且这些研究成果将为函数型线性模型多重共线性的研究奠定了理论基础;其次,介绍了三种典型的函数型线性模型,并对模型的估计问题进行了探讨;再次,在函数型线性模型的基础上建立了响应变量来自指数分布族的函数型广义线性模型,将函数型广义线性模型转换为有限维空间内的截断模型,并对其估计问题进行了研究;最后给出了函数型广义线性模型的特例:函数型Logistic模型,并对模型进行了随机模拟。 第四章首先对三类模型:广义线性模型、广义可加模型、投影寻踪模型,进行了比较分析;其次结合广义可加线性模型和投影寻踪模型的特点,给出了基于广义可加模型的函数型投影寻踪回归模型(FGAM_PPR模型);最后,给出了该模型的基本形式,并采用极大惩罚似然迭代法对FGAM_ PPR模型的估计问题进行了试探性的研究。 第五章首先讨论了经典时间序列模型和有限维空间上的非参数自回归模型的基本原理。将传统时间序列分析的思想推广到函数型数据的结构框架下,在Hilbertian空间下给出了一阶函数型自回归模型的基本形式,建立了函数型自回归模型(FAR(1))和基于粗糙惩罚的函数型自回归模型(Smooth_FAR(1)),并对模型的估计问题进行了探讨;其次对函数型自回归模型进行了扩展,在一阶函数型自回归模型中引入外生变量,建立FARX(1)模型;最后,将FAR(1)、Smooth_FAR(1)模型应用于美国月度制造业非耐用品生产指数的预测,并对ARIMA(1,1,1)模型、非参数自回归模型、Kernel_FAR(1)模型和Smooth_FAR(1)模型的预测效果进行了比较分析。 第六章对本文的研究成果做了总结,对未来进一步的研究提出了展望。