广义线性模型中纠编估计的再回归方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:yyy8881200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广义线性模型在经济、生物、医学等领域中有着广泛地运用。然而随着实验样本的增加,特别是当维数p远大于样本数量n时,传统的估计方法选不出真实的模型。在这样的高维问题中,我们用惩罚来做模型的变量选择,即把无用的变量系数压缩为零,而把真正起作用的回归参数保留下来。   考虑广义线性模型Yi=G(Xiβ)+εi,i=1,…,n其中Y服从指数族分布f(y.口,(ψ))=exp{y0-b(0)/a((ψ))+c(y.(ψ))}它的变量选择有以下几种基本方法:   第一,LASSO方法   (β)n(glm)=argminβnΣi=1[-yi(XTiβ)+b(XTiβ)]+λnpnΣj=1|βj|   第二,Dantzigselector   min||β||1subj(e)ctto||l(″)((β)mle)(β-(β)mle)||∞≤λ   第三,Bridge方法   (β)n(glm)=armminβnΣi=1[yi-G(XTiβ)]2+λnpnΣj=1|βj|r   虽然这些方法解决了用超多变量来做估计的困难,但是它们都把有显著意义的变量给压缩了。这种偏差会随着p的增大而显著增加。本文研究了估计参数的期望与惩罚参数之间的关系。发现三种方法在一定的条件下,都有统一的关系式。如下所示(β)λκ=β+(φ)(β,μ)/nλκ+(ε)κ因而由这个统一形式,我们重新建立一个线性回归模型,把(β)λk看成Y,把λk看成X。很显然,线性模型的常数就是参数真值,估计它我们会重新得到了参数估计值。通过定理和数值模拟,都可以证明再回归得到的估计能使偏差和方差都减小。
其他文献
学位
在图论中,有关哈圈和哈路的问题一直是图论学者研究的重点之一.随着Dirac和Ore将哈圈与度约束条件联系起来后,有关哈密尔顿性的度约束条件成为了学者们研究的热点.二部有向图是
随着世界经济一体化的加快,多式联运作为国际物流服务中的一个重要环节,以其灵活、方便、安全等特点而倍受货主的亲睐。关于多式联运优化问题的研究,即如何对运输路径和运输
“蒙山红”是山楂品种“甜红子”芽变新品种。2010年通过山东省农作物品种审定委员会审定。该品种果实扁圆形,纵径2.02 cm,横径约2.70 cm。果个大,平均单果重14.15 g,大小整
最小费用最大流问题作为网络流问题的组成部分,主要研究的是网络最优化问题,它在工程、经济及科学等领域有着重要意义。其主要涉及最短路、最大流及最小费用流等方面的问题,随着
本文研究竞赛图中满足一定最小出度条件的点不交4-圈问题.这篇文章只考虑有向图,除非特殊说明,否则下文提到的圈都是有向圈.令G是一个有向图,V(D)表示它的顶点集,A(D)表示它的弧集.称圈C是一个q-圈,如果|V(C)==q.令T是一个有向图,如果对T中任意两个不同顶点χ和y.恰有(χ,y)或者(y.χ)中的一条弧属于A(T),则称T是一个竞赛图,设v e V(T).则点v在T中的出度表示为d+(
学位
期刊
设N,F为有限群.若存在有限群G,它具有正规子群N~使得N~()N且G/N~()F,则称群G为群F的扩张.若N~≤Z(G),则称群G为群F的中心扩张.特别地,若∣N∣=2,称G为群F的2次中心扩张.本文利用中心扩
分析了油井气锁形成原因,同时进行油井正常生产与发生气锁时的生产数据对比,并探讨了油田气锁的分析与处理,以期为油井气锁的分析与处理提供一些参考,确保油井的正常生产.
随着科学信息计算的发展,在各个工程技术领域中(如医学、军事等)出现大量的数字图像(包括造影图像、红外图像等),需要有效、快速的提取数字图像中的有用信息,因此图像分割、目标特征