论文部分内容阅读
Logistic回归模型是处理因变量为分类变量的有力工具,应用范围非常广泛。目前为止,已有众多的理论和方法。但这些理论和方法主要在同一个前提下讨论问题,即观测值独立同分布。然而,在实际问题中,为减少抽样误差,研究者往往采用复杂抽样设计,并在此基础上讨论统计推断问题,以便所得结果更加贴近实际。因此,“观测值独立同分布”这一前提并不容易满足,有必要将抽样特征纳入到模型中进行统计分析。 论文第一部分叙述了Logistic回归模型的研究背景和国内外研究现状,然后对论文的布局做了说明。 论文第二部分探讨了传统Logistic回归模型的构造,参数估计,以及模型参数的显著性检验和模型的拟合优度检验问题。为进一步研究复杂抽样数据的Logistic回归模型奠定基础。 第三部分为论文的核心。在传统Logistic回归模型的基础上,建立基于复杂抽样数据的Logistic回归模型。将抽样特征和抽样权重综合考虑进样本的似然函数中,得到模型的近似似然函数。利用迭代算法求出模型参数的极大似然估计。同时,利用泰勒近似展开的线性化方法,求出模型回归系数估计的协方差阵,给出协方差阵的一个调整因子。最后,分别运用传统Logistic回归模型和复杂抽样Logistic回归模型对分层抽样数据的常数项估计值和概率平均估计值进行比较,得出对分层抽样数据进行统计分析时,使用复杂抽样的Logistic回归模型能更好地拟合数据的结论。 论文最后一部分给出了模型的回归系数的两种显著性检验统计量和三种拟合优度检验指标。在实例分析部分,同时运用传统Logistic回归和复杂抽样Logistic回归两种方法对来自分层整群抽样的数据集进行建模分析。对比两者的分析结果,得出结论:当数据集来自复杂抽样过程时,复杂抽样数据的Logistic回归模型使用效果更好。