论文部分内容阅读
回归分析方法在临床科研工作中被广泛应用,但由于生命现象的复杂性,尤其是在探索性研究中,我们常常不能确定所要建立回归方程中各项的基本形式。此时,一些常用的经典参数回归方程就显得束手无策了,而广义可加模型则是解决这一问题的一个好的途径。本文在研究广义可加模型的基础上对用此模型分析数据所出现的异常点的影响、共曲线性问题进行了较深入的研究,并介绍了几种克服方法,同时给出了医学应用的实例。 为了解决高维度带来的模型解释上的困难,Friedman 和 Stuetzle 于1981 年提出了投影-追踪回归(Projection Pursuit Regression),它是利用对预测变量进行恰当方向的投影来达到降维的目的,这也是可加模型的雏形。之后,Hastie 和 Tibshirani 于 1984 年将可加模型的技术应用于广义线性模型,这就产生了广义可加模型。很多情况下,参数回归方程不能很好地反映预测变量与反应变量间的关系。这时,我们可根据具体情况改变两者间的函数形式建立模型来描述它们间的关系。一种是改变反应变量期望的函数形式,我们把它记为g(μ),其中μ = E(Y / X1,.....,XP)。此时的模型可写为 g(μ)=α + β1X1 +.... + βPXP ,我们称之为广义线性模型(GeneralizedLinear Models GLM)。另一种是用非参数的形式来描述反应变量的条件期望与预测变量的对应关系,用 f (x)表示。此时的模型可写为E(Y / X )= f (x),进一步推广到多个预测变量时则变成模型E(Y/X1, ....,XP)=α+f(X1)+ .... +f(XP),我们称之为可加模型(Additive Models)。若将两种形式结合起来,则模型可写为 g(μ)= α + f (X1)+ .... + f (XP ) ,此模型我们就称之为广义可加模型(Generalize Additive Models GAM)。可以看出,广义可加模型是广义线性模型和可加模型的结合形式。它对资料的要求较少,所以适用范围非常广泛。尤其是在 Poisson 回归和 Logistic 回归类型的资料中应用很多。但它也有一些缺点:①它没有考虑预测变量间的交互作用;②它只是对真实曲面的近似,在预测变量数目较大时精确性不高。尽管如此,由于它具有其它方法所不可比拟的优越性,所以它在医学研究的各个领域得到了越来越广泛的