Logistic回归模型的参数估计与共线性问题的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:adidas9910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Logistic回归模型是一种常用的广义线性模型,在医学、环境、社会科学以及经济学等方面有着广泛的应用。本文主要分成三个部分:第一部分详细地讨论了Logistic回归模型的定义、估计和性质等。第二部分研究了Logistic回归模型中参数的极大似然估计的方差.协方差矩阵与模型的设计矩阵之间的关系;首先得出了方差.协方差矩阵的不可估等价于设计矩阵中自变量的完全多元共线性的结论,之后证明了自变量的多元共线性在Logistic回归模型中也必定会导致极大似然估计的方差膨胀。文章的第三部分提出了改善Logistic回归模型中自变量的多元共线性问题的一种方法——主成分分析法,这种方法在多元线性模型中有着广泛的应用及深入的研究, 本文采用主成分分析法对Logistic回归模型中出现的多元共线性现象进行改善。文章首先详细叙述了主成分分析的思想、定义以及计算方法;证明了在Logistic回归模型中主成分分析仍具有的一些良好性质。最后,我们从主成分估计的方差的改善程度着手,提出了在Logistic回归模型中主成分分析方法仍具有的一个缺陷,即主成分极大似然估计的方差不具有一定意义下的方差最小的性质;文章通过模拟数据,证实了主成分分析确实减小了极大似然估计的方差和偏差,但是方差的减小还是很有限的。最后文章提出了改善主成分估计的一种方法;这种方法的目的在于进一步减小极大似然估计的方差。同时文章也指出了这种方法在理论和实际应用上的局限性。总之,多元共线性问题是当前Logistic回归模型中的一个研究热点,此问题仍需要进一步的研究。文章的最后还讨论了Logistic回归模型中多元共线性问题在实际应用中的具体情况。
其他文献
在WDM(波分复用即wavelength division multiplexing)网络中,组播(multicast)即一对多(one-to-many)或多对多(many-to-many)的通信机制,一个组播请求(multicast session or r
在数学物理问题中,诸如不同介质的热传导、电场分布等问题,都将产生求解具有间断系数的椭圆型微分方程边值问题,即所谓椭圆型界面问题.界面问题的系数函数、右端源项以及解在
美术作品中动态因素与体育运动的发生是有些关系的.在表现诸多动态因素之美感时,画面中的动态表现形式是多种多样的.一幅优秀的美术作品包含着人们对生命动态的极尽表述.
该篇博士学位论文主要是应用无穷维动力系统中关于全局吸引子理论的最新研究成果并结合能量估计技巧,研究了吊桥型方程及其偏微分耦合动力系统全局吸引子的存在性问题,分别得
该文在简单回顾非寿险风险模型研究历史的基础上建立了一个基于进入过程的风险模型.我们利用点过程的理论和方法研究了索赔数过程,风险过程和在保人数过程的特征(随机强度过
解病态(ill-conditioned)线性问题的理论和算法是数值代数领域的一个重要而又非常困难的问题。在解该问题中经常会遇到带参数的位移线性系统。本硕士论文着力讨论解形如(ATA+
当前,中小学生作文普遍存在“言之无物”和“言之无文”的弊端,一个重要的原因是作文教学缺乏“细节”意识的培养和“细节”表现技巧的锤炼.rn所谓细节,是对人物、环境的某一
为数值求解刚性微分方程初值问题,已经构造了许多方法.其中改进的二阶导数法[1]是一类很重要的方法,它不但可以获得较高的精度阶,而且可以得到较大的稳定性区域,其缺点是它所
本文研究了人工神经网络在数值优化中的应用,针对不同类型的问题构建了相应的神经网络模型。对于无约束优化问题,给出了BFGS和PRP神经网络模型和数值试验。此外,还第一次将“障
忠实平衡自正交双模是模类里的一种重要的研究对象。它广泛运用于倾斜模和余倾斜模理论及CM-环理论中。本文主要研究与忠实平衡自正交双模相关的模的性质。本文分为三个部分