论文部分内容阅读
半参数模型不仅具有非参数模型的灵活性而且保留了参数模型易于解释的优点。因此它们到了许多学者的广泛关注并且在经济学、生物学以及医学等领域有着广泛的应用。本文主要研究了变系数模型、部分线性可加模型和变指标系数模型这三类重要的半参数模型。现存的估计方法大多基于最小二乘或似然函数的方法。众所周知,这两种估计方法不稳健,因为它们对数据中的异常点或者厚尾误差分布比较敏感,从而大大降低估计的效率。更糟糕的是,当误差的二阶矩不存在时,最小二乘估计不再是相合的。因此,这就启发我们从不同角度寻找多种稳健的估计方法。另一方面,变量选择无疑是统计建模的一项基础而重要的工作。因为我们希望一个好的统计模型只含有与响应变量相关的协变量,从而得到更简洁的模型结构和增强模型的预测能力。因此本文的研究目的是对变系数模型、部分线性可加模型和变指标系数模型构造一系列稳健且有效的估计程序以及实施变量选择。具体地,本文的研究内容包括以下三部分。第一部分研究了变系数模型的稳健估计与变量选择问题。本文第二章利用B样条基函数近似、双重SCAD惩罚函数和秩回归对变系数模型构造了一种稳健且有效的统一变量选择方法。这里的统一变量选择方法是指在没有任何先验信息下,该方法不仅能够选择出重要的协变量而且还能同时区分常系数效应与变系数效应的协变量。在适当的条件下,我们证明了所提方法在选择重要变量和常系数效应与系数效应的区分方面都是相合的,以及非零参数估计具有Oracle性质,同时数值模拟和实例分析验证了所提方法的稳健性与有效性。注意到第二章所考虑的变系数模型不能处理离散响应变量。因此,本文第三章研究了更灵活的广义变系数部分线性模型,该模型不仅能够处理非高斯数据而且还能处理非线性的连接函数。在广义变系数部分线性模型的框架下,我们利用指数得分函数和权函数构造了稳健的估计方程。新估计不仅能够同时克服响应变量和协变量中异常值的影响而且还具有很好的有效性通过选择合适的调节参数。进一步,我们基于Ueki(2009)提出的光滑阈估计方程构造了关于参数部分的稳健变量选择程序。在适当的条件下,证明了所提估计具有Oracle性质。另外,基于Newton-Raphson的思想,我们给出了求解稳健估计方程数值解的迭代算法,同时还讨论了在实际问题中如何选择估计方程中所涉及的一系列调节参数。数值模拟和实例分析进一步验证了所提方法的优越性。第二部分研究了部分线性可加模型的稳健估计与变量选择。本文第四章利用B样条基函数近似、双重SCAD惩罚函数和众数回归对部分线性可加模型构造了稳健的变量选择方法。在合适的条件下,该变量选择方法在选择重要的参数和非参数分量方面都是相合的,并且得到的非参数估计达到最佳收敛率以及非零参数估计具有Oracle性质。同时,我们利用EM算法和局部二次近似给出了求解惩罚估计的实施步骤。数值模拟和实例分析均表明所构造的估计量是稳健的且与存在的估计方法相比具有很大的优越性。本文第五章研究了具有纵向数据结构的部分线性可加模型。在分位数回归的框架下,我们构造了新的估计函数基于工作相关矩阵。该方法的最大优点在于它不仅可以处理纵向数据的组内相关性而且还具有稳健性。为了克服估计函数非凸、不连续以及不可微等问题,我们运用Brown和Wang(2005)所提的感应光滑方法获得所提估计方程的数值解。此外,我们构造了一种稳健的光滑阈广义估计方程来处理变量选择问题。在合适的条件下,证明了所提估计具有Oracle性质。数值模拟和实例分析进一步验证了所提方法的优良性质。第三部分是关于变指标系数模型的稳健估计问题的研究。变指标系数模型是一类非常灵活的半参数模型,它包括了许多常见的半参数模型,比如变系数模型、变系数部分线性模型、可加模型、部分线性可加模型等。在第六章中,我们运用B样条基函数和众数回归对变指标系数模型构造了新的稳健估计程序。因此,本章的研究可以看成是第四章的拓广。在理论上,我们证明了所提估计的大样本性质,包括估计的相合性与渐近正态性。同时,我们结合EM算法和Fisher’s score方法给出了求解估计的实施步骤。数值模拟和实例分析表明所提估计表现得很好。