论文部分内容阅读
由于纵向数据是对每一个观测个体在不同时间点上进行多次重复测量而收集到的数据,因此,由同一个观测个体获得的数据间存在着一定的组内相关性.在传统的统计推断中,样本之间的相互独立性是一个常用的假设.但当建模纵向数据时,忽略了数据的组内相关性,必然会造成信息的缺失,从而降低推断的效.包含随机效应的混合效应模型是建模具有组内相关性的纵向数据的常用方法之一.而作为兼有参数模型的便捷性和非参数模型的灵活性的半参数回归混合模型更是被越来越多地应用到科学研究的各个领域.另外,在对混合效应模型进行推断时,除了估计模型中的兴趣参数之外,往往还需要选择重要的变量和剔除不显著的变量.而现有的关于纵向数据分析的研究主要集中在对边际模型进行变量选择,对混合效应模型的变量选择的研究还比较少.因此,关于半参数变系数混合效应模型的有效估计和变量选择的研究具有一定的理论意义和实用价值.具体地讲,论文主要包括如下的几个方面:结合随机效应和B样条光滑技巧,针对纵向数据下部分线性变系数模型,研究了模型中参数分量和非参数分量的有效估计问题.通过假设模型的随机效应和误差项满足方差分量模型,我们构造了组内协方差阵的一个相合估计,并由此获得了感兴趣参数的改进估计量.在给定的正则条件下,我们证明了方差分量,参数分量和非参数分量的估计量都具有渐近正态性,并且参数分量估计量的渐近方差达到半参有效界.数值模拟进一步说明了估计方法的有效性和估计的效的提高.其次,本文研究了当考虑到组内相关性时,对模型进行变量选择的方法.利用所提的变量选择方法,我们可以对模型中的兴趣参数同时进行选择和估计.通过选择合适的参数,本文建立了估计量的相合性和“Oracle”性质.同时,由于在对模型进行变量选择时考虑了数据的组内相关性,参数分量的估计量的渐近方差达到半参数有效下界,是半参数有效的估计量.最后,通过模拟研究考察了组内相关性对变量选择结果的影响,验证了本文所提方法的良好的样本性质.对变系数混合效应模型,我们结合考虑数据的组内相关性,提出了能同时选择模型的参数效应和非参数效应的变量选择方法.该方法能同时对模型和模型中的参数进行选择和估计,降低了模型被错误指定的风险.同时,由于考虑了数据的组内相关性,估计量的效还得到了显著的提高.在一些给定的假设条件下,证明了估计量的相合性和最优收敛速度,建立了参数分量的渐近正态性.最后,通过随机试验说明了该方法的可行性.其次,基于经验似然方法,考虑了非参数分量的置信区间的构造问题.结合随机效应考虑了数据的组内相关性,构造了基于残差调整的广义分块经验对数似然比统计量.在不需要假设欠光滑的条件下,证明了该对数似然比统计量渐近地依分布收敛到标准的卡方分布,进而构造了模型中感兴趣的非参数分量的逐点置信区间和同时置信域.由于考虑了数据的组内相关性,推断的稳健性得到了显著的改善.最后,本方法的有效性也通过数值模型和实例分析得到了验证.对具有随机效应的广义部分线性模型,我们基于局部估计方程,提出了一个获得模型中兴趣参数有效估计的估计方法.结合模型的随机效应,构造了组内协方差阵的一个相合估计,发展了一个将组内协方差阵以一种“合理”的方式引入到局部估计方程中的方法,在充分使用样本信息,获得有效估计的同时,却不增加估计的偏差.在确保组内协方差阵估计量的收敛速度的条件下,证明了由将估计方程中的真实协方差阵替换为它的估计量所造成的误差是渐近可忽略的.同时,在一些给定的条件下,我们证明了所得到的参数分量和非参数分量的估计渐近服从正态分布.最后的模拟研究表明了利用该估计方法可以显著地改进估计的效.结合样条和局部多项式光滑方法,本论文主要讨论了半参数变系数混合效应模型的有效估计和变量选择问题.首先,对带有随机效应的变系数或广义部分线性模型,根据模型的结构特点,以合理的方式考虑了数据的组内相关性,获得了兴趣参数的有效估计.其次,结合随机效应,考虑了纵向数据下的变系数模型的变量选择和经验似然推断问题.理论研究和数值模拟都表明了基于随机效应的组内相关性的引入,有助于提高估计的效,增强了推断的稳健性.本文的结论和方法丰富了变系数模型及其变形模型的有效推断方法,拓展了变量选择和经验似然推断方法的使用范围,达到了简化模型结构,进而提高预测精度的目的.