基于函数型数据的模型研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:joiner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的统计分析中,一般把数据看成是有限的离散点,是单个观测值的顺序排列,所选取的数据一般来自时间序列、截面数据、纵向数据等不同的数据结构,针对不同的数据结构都有与其相匹配的统计方法进行研究。但如今随着信息技术的发展,人们获取和存储数据的能力得到了极大的提高,大量形式各异的复杂型数据不断涌现,例如高频数据、缺失数据、流式数据、曲线、曲面以及图像等无限维数据,这些数据往往呈现出某种函数的特性,因此越来越多的数据可以用函数型数据的形式表示。由于传统的统计分析方法通常依赖过多的假设条件,往往不适用于分析这种复杂的数据类型,因此,函数型数据分析方法作为一种新的研究方法随之产生。  函数型数据分析(Functional Data Analysis,FDA)是从函数的角度对数据进行分析,把函数型观测数据(χi=(χi1,χi2,…,χiT))看成一个整体,表示为光滑曲线或连续函数xi(t),i=1,…,N,其中N表示观测对象曲线的个数,t可以表示时间,当然也可以表示时间以外的其它变量,这里的“函数”是指数据的内在结构,而不是数据的外在形式。函数型数据分析方法开始关注无限维数据,并较少的依赖假设条件,从函数的角度进行数据分析,能够更多的挖掘出数据的隐含信息。因此,函数型数据分析方法近年来得到了较快的发展,已经成为统计学领域研究的热点问题之一。  目前,关于函数型数据分析方法的研究成果不断涌现,国外学者对函数型多元统计分析、函数型线性模型等理论方面均取得了较好的研究成果;此外,该理论被应用于医学、生物学、环境计量学、化学计量学等诸多领域。但函数型数据分析目前仍处于起步阶段,理论方面还存在很多的问题需要改进和完善,还应继续推广该方法的应用领域,如在经济、金融等方面的应用。目前,我国对函数型数据分析方法的研究还处于初步学习阶段,国内学者基本是针对函数型数据分析的基本思想做综述性的研究,或是在一些理论基础上做一些简单的应用,因此,对函数型数据分析理论及应用的研究具有创新性和挑战性。  本文尝试从函数型线性回归模型及其拓展和函数型时间序列预测模型这两个大的方面对函数型数据分析方法的理论进行探讨,并将理论应用于研究经济领域的实际问题中。研究方法上,采用传统回归分析、计量经济分析、多元统计分析、函数型数据分析、非参数统计、随机过程等多种理论方法相结合,对所研究模型进行理论推导,并与实证分析相结合对实际经济问题进行研究,实证结果表明函数型数据分析方法较之其他的统计方法有更多的优越性。  全文共有六章内容:第一章为引言,介绍了选题背景及选题意义,对函数型数据分析的研究现状做了综述,阐述了本文的主要研究内容与创新之处;第二章从整体上对函数型数据分析方法进行了概述;第三章讨论了函数型线性模型及其扩展;第四章讨论了基于广义可加模型的函数型投影寻踪回归模型;第五章讨论了函数型自回归预测模型;第六章总结了本文的研究成果,并对未来进一步研究的内容做出了展望。  第一章为本文的引言部分。首先介绍了选题背景及选题意义;其次从函数型主成分分析研究、函数型线性模型研究、函数型时间序列分析研究三方面对函数型数据分析方法的研究现状进行了综述;最后阐述了本文的研究内容和创新之处。  第二章从整体上对函数型数据分析方法进行了概述。首先介绍了函数型数据的基本特征,比较了FDA方法与传统统计分析方法的不同,给出了FDA方法的优点;其次分析了函数型数据分析的基本目的和步骤,给出了对函数型数据进行预处理的基本方法;最后介绍了传统的主成分分析和函数型主成分分析。  第三章首先从传统回归模型研究做起,对线性模型的一种有偏估计c-(K,S)型估计进行研究,得出了c-(K,S)型估计在MSEM准则下的优良性,给出了MSEM准则下估计量相对效率的界,并证明了c-(K,S)型估计的可容许性,此理论对线性模型多重共线性的改进起到了积极作用,而且这些研究成果将为函数型线性模型多重共线性的研究奠定了理论基础;其次,介绍了三种典型的函数型线性模型,并对模型的估计问题进行了探讨;再次,在函数型线性模型的基础上建立了响应变量来自指数分布族的函数型广义线性模型,将函数型广义线性模型转换为有限维空间内的截断模型,并对其估计问题进行了研究;最后给出了函数型广义线性模型的特例:函数型Logistic模型,并对模型进行了随机模拟。  第四章首先对三类模型:广义线性模型、广义可加模型、投影寻踪模型,进行了比较分析;其次结合广义可加线性模型和投影寻踪模型的特点,给出了基于广义可加模型的函数型投影寻踪回归模型(FGAM_PPR模型);最后,给出了该模型的基本形式,并采用极大惩罚似然迭代法对FGAM_ PPR模型的估计问题进行了试探性的研究。  第五章首先讨论了经典时间序列模型和有限维空间上的非参数自回归模型的基本原理。将传统时间序列分析的思想推广到函数型数据的结构框架下,在Hilbertian空间下给出了一阶函数型自回归模型的基本形式,建立了函数型自回归模型(FAR(1))和基于粗糙惩罚的函数型自回归模型(Smooth_FAR(1)),并对模型的估计问题进行了探讨;其次对函数型自回归模型进行了扩展,在一阶函数型自回归模型中引入外生变量,建立FARX(1)模型;最后,将FAR(1)、Smooth_FAR(1)模型应用于美国月度制造业非耐用品生产指数的预测,并对ARIMA(1,1,1)模型、非参数自回归模型、Kernel_FAR(1)模型和Smooth_FAR(1)模型的预测效果进行了比较分析。  第六章对本文的研究成果做了总结,对未来进一步的研究提出了展望。
其他文献
社会保险是社会保障的重要组成部分,在促进社会公平、维护社会安定方面发挥着“内在稳定器”的作用。随着经济的发展,人们的生活水平不断提高,面临的生存压力越来越大,因而对社会
采用线段和圆弧作逼近基元是数字曲线拟合中的一个难点 ,文中给出一种基于改进遗传算法的拟合方法 .通过对点列进行二进制编码 ,以拟合段数较少和拟合误差较小为优化目标 ,变异概率和交叉概率自适应生成 ,并根据相关知识控制分界点间隙 ,所得最优解中值为 1的基因对应数字曲线的分界点 .对线段与圆弧相交和相切以及具有噪声等多种情况进行检测 ,可同时提取尖点和切点 ,还可得到逼近基元及其之间关系 ,较好地解
随着经济全球化、金融全球化的不断深入发展,区域金融的发展逐渐由依附物资资本转向依附人力资本了。人力资本已成为区域金融发展的重要因素,研究人力资本和区域金融发展的关系
现行出口退税制度是我国税收制度的重要组成部分,也是国际上通行的一项税收政策。我国自1985年恢复实施的出口退税制度在优化出口商品结构、增强出口产品国际市场竞争力、拉动
我国正处于国民经济和资本市场快速发展的大背景下,新股如雨后春笋般上市。伴随着IPO的迅猛发展,A股市场IPO收益率也成为国内学者关注的热点。IPO首日高收益率和长期弱势是资本
中学历史知识虽然不难,但很繁杂。如果让学生化很多时间去记去背,那么势必与所谓的“主学科”产生冲突。因此,历史教师应该帮助学生化繁为易,教给他们合适的学习方法和趣味记忆的技巧。初中历史课长期以来一直被同学们认为是一门“副科”、“不重要”,而且历史学科中的许多历史事件由于远离现代而陌生,相当一部分同学接触到历史教材中大量的时间、人物、事件后,觉得难学难记,枯燥烦琐,于是产生厌学情绪。如何引导初中生学习
可转换债券的市场定价低于其理论价值是一个全世界范围内普遍存在的金融问题。近年来,国内学者也发现中国可转债市场上存在着不同程度的价值低估现象。股票市场卖空机制的缺失
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
随着 Internet的广泛应用 ,对多媒体数据在 Internet上的安全传输、分发与交易的安全性保障越来越重要 ,如何使数字作品在网上直接交易 ,也是电子商务的一个重要课题 .文中综述了公平交易协议 ,提出了一种基于数字水印和公平交易协议的数字图像电子交易方案 .此方案具有交易的公平性和对图像作品的版权保护的特点 .