基于复杂抽样数据的Logistic回归模型及应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:castchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Logistic回归模型是处理因变量为分类变量的有力工具,应用范围非常广泛。目前为止,已有众多的理论和方法。但这些理论和方法主要在同一个前提下讨论问题,即观测值独立同分布。然而,在实际问题中,为减少抽样误差,研究者往往采用复杂抽样设计,并在此基础上讨论统计推断问题,以便所得结果更加贴近实际。因此,“观测值独立同分布”这一前提并不容易满足,有必要将抽样特征纳入到模型中进行统计分析。  论文第一部分叙述了Logistic回归模型的研究背景和国内外研究现状,然后对论文的布局做了说明。  论文第二部分探讨了传统Logistic回归模型的构造,参数估计,以及模型参数的显著性检验和模型的拟合优度检验问题。为进一步研究复杂抽样数据的Logistic回归模型奠定基础。  第三部分为论文的核心。在传统Logistic回归模型的基础上,建立基于复杂抽样数据的Logistic回归模型。将抽样特征和抽样权重综合考虑进样本的似然函数中,得到模型的近似似然函数。利用迭代算法求出模型参数的极大似然估计。同时,利用泰勒近似展开的线性化方法,求出模型回归系数估计的协方差阵,给出协方差阵的一个调整因子。最后,分别运用传统Logistic回归模型和复杂抽样Logistic回归模型对分层抽样数据的常数项估计值和概率平均估计值进行比较,得出对分层抽样数据进行统计分析时,使用复杂抽样的Logistic回归模型能更好地拟合数据的结论。  论文最后一部分给出了模型的回归系数的两种显著性检验统计量和三种拟合优度检验指标。在实例分析部分,同时运用传统Logistic回归和复杂抽样Logistic回归两种方法对来自分层整群抽样的数据集进行建模分析。对比两者的分析结果,得出结论:当数据集来自复杂抽样过程时,复杂抽样数据的Logistic回归模型使用效果更好。
其他文献
学位
学位
造成数学学困生的因素很多,但是只要细心总结,不难发现归纳起来不外乎两种——智力因素和非智力因素.对于健康人来说,智力水平相差甚小,但为什么在学习上会出现很大的差距呢?
美,原本就是一项信仰,也是一种认知的行为。美,不知何时出现、何时有情趣,或者说有美感。但是,美并不是遥不可及的名词,而是与生活息息相关的动词。美应用在思想上时,它的成
高中政治教学的主要目标就是对于思想政治教育进行开展,从而引导学生对于正确的世界观、人生观、价值观进行树立,但高中的政治教学过多地将重心放在书本理论之上,而没有对于
学位
研究了量子信息中束缚纠缠态的构造及应用、纠缠态的检测和图积态的可分性.对任意子系统而言通过局部运算和经典通信的方法都不可提纯的纠缠态称为束缚纠缠态.首先,构造了2(@)
杂交水稻品种川优8377系四川省农业科学院作物所用自育不育系川358A与自育恢复系成恢377组配育成,2012年通过国家农作物品种审定委员会审定,系当前长江流域唯一通过国家审定
近年来,性别生态学一直是理论生态学和数学生态学研究的热点问题之一,而性比策略的选择机制作为性别生态学的重要问题之一更是当今研究的前沿领域。本文首先建立了生物种群性比
学位