论文部分内容阅读
单指标模型是只有一个未知参数向量且联系函数未知的回归模型,常见的logistic模型、log-linear模型、probit模型等重要的统计模型是单指标模型特殊的参数形式。单指标模型在工业、医学、经济和社会数据的统计分析中有广泛的应用。由于在单指标模型中不假设联系函数的具体形式,它放松了参数模型中条件的限制,同时,与非参数模型相比它又保持了线性模型的优点,用之于统计建模可起到降维的显著功效。关于它的参数估计和统计推断在近些年来越来越受到关注。
转变点模型一直是统计学中很热门的一个研究方向。人们对它的关注起源于工业自动控制。随着社会的发展,在经济、金融、计算机等方面,转变点模型有着越来越多的应用。所以,从上个世纪五六十年代开始,有许多统计学者对它进行了深入的研究。
本文首先研究在至多存在一个转变点的单指标模型中,是否存在转变点的假设检验问题。基于观测值[Z<,i>=(X<,i>,Y<,i>),i=1,…,n},我们构造了一个样本轨道属于(D[0,1])
的随机过程Q<,n>(·),在此基础上构造了有关的检验统计量:T<(1)><,n>和T<(2)><,n>。并证明了该过程在原假设之下依分布收敛到一个多维的Brown桥过程。在给定检验水平α(0<α<1)之下,设检验统计量T<(3)><,n>的临界值为c,则该假设检验接受域为{T<(2)><,n><,n> <,n>极限分布难以计算,因而c很难确定。受Horváth和Husková(2005)利用置换U-统计量的方法来检验分布变点问题的启发,我们利用随机置换的方法,构造了Q<,n>(·)的随机置换的副本Q<*><,n>(·),证明了无论原假设成立与否,Q<*><,n>(·)在给定{Z<,1>,…,z<,n>}的条件下的条件分布与Q<,n>(·)在原假设下的分布有同样的极限分布。因而,无论原假设成立与否,基于Q<*><,n>(·)的检验统计量T<(2)*><,n>的条件分布与T<(2)><,n>在原假设之下的分布有同样的极限分布。由此,我们可以通过T<(2)*><,n>的重复置换来确定检验的临界值c<*><,n>,而当T<(2)><,n>>c<*><,n>时否定原假设。容易证明,我们这种检验方法的一个优点在于给定检验水平α时,接受域为{T<(2)><,n> <,n>}的检验和接受域为{T<(2)><,n> <,n>的条件分布可以很好的逼近T<(2)><,n>在原假设下的分布,同时也表明转变点的估计值与真实值很接近。 最后,受Bai,Krishnaiah和Zhao(1991)一文中“EDC”准则的启发,将其准则中的log似然函数进行推广,提出了基于φ-散度度量的logistic回归模型中的变量选择(即子集选择)的方法,从待选的子集中选出使准则函数为最小者,作为真子集的一个估计。对给定的待选模型,其准则函数的形式为:Nnf<,β>D<,φ>(p,p(β))+l×C<,N>,其中D<,φ>(p,p(β))是概率向量p和p(β)之间的φ-散度度量,l是该模型中待估的参数个数,C<,N>依赖于样本量N,并且当N→+∞时,C<,N>/N→0,C<,N>/loglogN→∞。在很弱的条件下,我们证明了这种方法是强相合的。全文共分五章。第1章是引言,简要介绍了单指标模型中回归系数的几种估计方法、检验方面的有关的重要文献,转变点的有关大样本理论以及我们在这方面所取得的主要成果。第2章介绍的是至多一个转变点的单指标模型中,转变点存在性的检验方法。第3章用密度加权平均导数估计(ADE)方法得到单指标模型中转变点的一个相合估计。第4章是我们提出的检验和估计转变点方法的模拟计算结果。第5章是我们的第二部分工作,我们提出了基于φ-散度度量的logistic回归模型中的变量选择方法,并建立了它的强相合性。