论文部分内容阅读
纵向数据是指对每一组个体在不同时间进行观测而得到的由截面和时间序列融合在一起的数据,其特点是将截面数据和时间序列数据结合在一起,既能分析出个体随时间变化趋势,又能分析总体的变化趋势。近年来,对纵向数据各种模型的研究引起国内外统计学者的广泛关注。纵向数据广泛的应用于医学、生物学、社会学和经济学等领域,因此对纵向数据的研究具有十分重要的现实意义。
经典的Logistic回归模型只针对截面数据,研究某一随机事件发生的概率与某些因素之间的关系。若影响某一随机事件发生的概率有很多个体,且个体随时间发生变化,建立纵向数据的Logistic回归模型。本文以纵向数据的半参数模型为基础,建立了半参数纵向数据的Logistic回归模型,对此模型中的参数进行估计,讨论了参数的信息矩阵,并给出它的计算方法,其中参数的估计由一组非线性方程给出,设计了Newton-Raphson迭代算法求解此非线性方程组,从而得到未知参数的估计。模拟结果表明了算法的有效性。
纵向数据的研究中,数据缺失是一个十分常见的问题。缺失数据减少了样本的信息量,给统计分析带来了困难。如果不了解缺失机制,统计分析的结果可能存在很大偏差,有时甚至错误。EM算法是不完全数据问题中用于ML估计很通常的迭代算法。本文在假定了解缺失数据机制的基础上,用EM算法对有缺失的纵向数据的几种常见模型中的参数进行估计,并与不了解缺失机制估计的值作比较,得出在考虑缺失机制时,得到参数估计值的偏差较小。