变系数模型的研究与分析

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:syn301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非参数回归一般假定回归函数属于某一个函数类,如常常假定回归函数是一个光滑的函数,因此非参数回归对模型的假设很少,最主要的优点就是模型具有稳健性。非参数回归作为现代统计分析的主要方法之一,得到广泛的应用。对于非参数回归人们提出了许多估计方法,如核估计,局部多项式估计,光滑样条估计,级数估计(傅里叶级数估计,小波级数估计)等。这些方法本质上讲都是局部估计或局部光滑,当回归变量X为一维变量时,非参数回归函数用这些方法一般都能得到很好的估计。但当回归变量是多维向量时,由于X的局部邻域包含很少的数据,用这些估计方法,很难估计出一般的多元非参数回归函数,人们把这种现象称为‘维数祸根’(the curse of dimension)。可是实际中我们经常遇到的是高维数据,因此高维数据分析是人们一直关心的问题,近年来统计工作者提出了许多分析方法,总得来说可以分为两大类:一类称为函数近似(function approximation),如可加模型(Hastie and Tibshirani,1986),部分线形模型(Engle, et al; 1986);另一类为降维(dimension reduction),如SIR回归(sliced inverse regression(Li,1991)),投影追踪回归(projection pursuit regression)(Friedman and Stuetzle,1981);图回归(graphical regression, Cook, 1994), PHD (principal Hessian direction)分析(Cook, 1998), MAVE方法(minimum average variance estimation method(Xia, Y. et al.,2002)。本论文主要讨论的是变系数模型(the varying coefficient model),属于函数近似这一类。 变系数模型的一般形式为 y=χ1β1(t1)+…+χpβp(tp)+ε (1)其中X=(χ1,…,χpT和t=(t1,…,tpT为回归变量,y为响应变量,ε为随机误差,Eε=0,Eε22l(tl),l=1,…,p为未知的光滑函数,t1,…,tp是通过未知的函数βl(tl)来改变χ1,…,χp的系数,βl(tl)暗含了tl与χl的一种特殊的交互关系,tl可能互不相同,也可能相同,也可能是某个χl。特别地,当t1,…,tp均相同时,不妨记为t,则模型(1)变为 y=χ1β1(t)+…+χpβp(t)+ε (2)本文我们都在模型(2)下讨论函数系数模型.华东师范大学博士学位论文(20韶) 相对于一般的多元非参数回归,变系数模型对回归函数的结构提出了一些限制.可是,尽管变系数模型看起来比较具体,实际上它是一个非常一般的模型,许多模型如可加模型,部分线形模型,线形模型等都可以看作是变系数模型的特殊情形.变系数模型既部分保留了非参数回归稳健性的特点,又具有结构简单,容易解释等优点.广泛应用到纵向数据分析,非线性时间序列分析,生物数据分析等,近年来受到人们的普遍关注(W、,。亡 all998:Fa:,andZ}lal,g,2000:Chiang,Riee and Wu:2001,Cai,Fanand Yao;2000)等. 本文提出用B样条函数和贝叶斯模型平均等方法来估计变系数模型中的函数系数,主要内容为: 第一章绪论,主要介绍常见的一些光滑方法,光滑参数,光滑参数的选择,高维数据,B徉条函数,变系数模型及其本文的主要内容. 第二章在数据为独立观察的场合下,给出了函数系数的B样条最小二乘估计,并讨论该估计的性质.假设弋二(二,,,…,从;),观察数据(军‘,弋,t‘)几1相互独立,它们为来自于变量(,,X,:)的样本,二(亡)=(二l仕),…,二N仕))了为。次B样条函数的基,N二。+k+1为基的维数,k为节点的个数.若山,l=1,…,p使得艺[::一(x*1二丫(‘:)al+…+二‘p二了(‘,)ap)]“最小.则模型(2)中的函数系数的B样条最小二乘估计八(,)二二了(t)dz假定凤(t)。cm卜,句,在一定的正则条件下,若节点个数k=O(。石轰了),函数系数的B样条最小二乘估计能够达到非参数估计的最优收敛速度(定理2.1)}}户(*)一。(,)*卜O;(二一击)) 进一步地,假定。1,…,。。独立,均值为。,方差尹已知,任意的l兰l兰熟国:城,且“一口(。流)则对任意给定的‘,风t)一流(t),…,几(t))·具有渐近正态性(定理2.3):万去(‘)(户(。)一刀(‘))马N(o,‘a,)华东师范大学博士学位论文归口0s) 第三章讨论了在纵向数据(lollsitlldillal data)场合下,函数系数的B样条M估计.在重复观察试验中,假设叭t)和x(t)是在时刻t的响应变量和回归变量,叭t)和X(t)之间有一种线性关系.即:粉(t)=X了(t)口(t)+:(t)其中。(幼是一个均值为。的随机过程, 现有。个个体,对第‘个个体有个体的第j次观察记为(物,弋,,t*,州弋,=X:(t勺)=(Xij;,…,X。,,)了〔Rp,万:,口(t)=(口1(亡),二。:次重复观测,,丙川)了是函数系数向量.(,(亡),X(t),亡)关于第乞个二1,…,.:7、*,艺儿1。*二。,其中=梦(t:,)·重复测量数据(物,弋,,ti;)可以看作是模型(3)的凸损失函数,7r(·)为B祥条函数的基,若d‘. 艺兄。(。,,一X‘;1·‘了(‘。)“,一的一个随机抽样.设风·)为一般1,…,p使得式子丸p·7r了(t*,)外)z=IJ二1最小,?
其他文献
<正> 男性生殖器的整形在我国刚刚开始,而在欧美这一整形研究已经开展了多年。男性生殖器的整形无疑是针对改善夫妻生活质量而产生的,它具有一定的市场需求。男性生殖器整形
对高压架空输电线路进行准确的故障测距是保证电力系统安全稳定运行的有效途径之一。为此 ,文章比较全面地介绍了国内外在此方面的发展历程和研究现状。根据各测距算法采用的
从天然气中回收的轻烃是优质的燃料,也是宝贵的化工原料,在世界能源日益紧缺的今天,轻烃回收对于我们整个石油化工及能源利用领域都有深远的意义。丘陵轻烃投产十年以来,平稳
【正】对外汉语教学与汉文化的关系早已引起人们的普遍注意,不少教师也对此陆续发表过一些很好的意见。下面,本文拟就语音、语法、词汇、汉字、修辞等教学环节同汉文化的关系谈
随着市场经济的日益发展和完善,中国婴幼儿奶粉市场的竞争日趋激烈。自2008年三聚氰胺事件之后,国民对中国本土品牌奶粉的产品安全产生了极大的忧虑,国外品牌奶粉大举进入中
油井套压,是油井生产的一个重要参数。它每一点变化直接影响着油井的沉没度、泵效及结蜡程度,进而直接影响油井原油产量。而油井套管压是千差万别的,针对每口井具体情况,科学
结合我国电力能源现状及相关政策,对水蓄冷技术进行了介绍,分别阐述了水蓄冷技术的主要设备,技术特点及优点,并对水蓄冷技术在空调系统中的应用及优势作了具体说明,以期促进
波菲里奥·迪亚斯时期的外交政策在墨西哥现代化战略中占有重要地位。他奉行的外交政策并不是从始至终保持不变的,也并非不加区别地将国家利益出卖给欧美列强。从第二任期开
A survey of petal-specific proteomes of soybean(Glycine max(L.) Merr[Non-italic].) was conducted comparing protein expression profiles in different petals. Two-
有关当代大学生学习心理方面的调查资料表明,相当一部分大学生身上不同程度地存在着学习心理障碍。大学生学习心理障碍主要表现为过分焦躁、学习积极性降低、存在懒惰心理和