logistic回归多重共线性诊断方法的研究

被引量 : 55次 | 上传用户:f281124698
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:研究logistic回归多重共线性的诊断方法,为模型的正确建立奠定基础。并且通过各种方法的比较,找寻适合于医学研究者使用的多重共线性诊断方法,便于医学研究者正确合理的建立logistic回归模型。方法:将多重线性回归的多重共线性诊断方法推广到logistic回归中。使用实例数据:某研究者进行的产后抑郁影响因素的研究,其中自变量包括与父母关系,人格量表EPQ的四个维度:EPQL、EPQE、EPQP、EPQN,既往抑郁史,产妇睡眠等。计算此实例数据自变量间的二元相关系数、方差膨胀因子、容许值、特征根系统、多重确定系数和行列式判别值。通过所得的计算结果,结合方法的易理解程度、操作的繁琐程度等综合判别几种方法的有效性和优缺点。结果:1.变量间二元相关系数:EPQE与EPQN, EPQL与EPQE, EPQL与EPQN, EPQP与EPQN的相关系数较大,存在共线性。2.方差膨胀因子与容许值:EPQE、EPQN的方差膨胀因子较大,容许值较小,此两个变量与其他变量之间存在多重共线性。3.特征根系统:四个特征根小于0.05,两个特征根小于0.01,模型中存在2-4个共线性关系。两个条件指数大于30。其中,条件指数为43.550对应的EPQL、EPQE的方差分解比例分别为88%和49%;条件指数为60.026对应的EPQE、EPQN的方差分解比例分别为48%和52%。EPQL与EPQE,EPQE与EPQN两对变量之间存在共线性。4.多重确定系数:除EPQN其他变量都可能引起多重共线性。5.行列式判别值:D=6.9296×10-10<0.01认为模型的某些变量间存在严重的多重共线性问题。6.根据几种诊断方法的结果,将存在多重共线性的变量移除,进行logistic回归得到的结论符合相关的文献研究。结论:logistic回归模型也对多重共线性敏感,因此需要对logistic回归模型的多重共线性问题给予重视。部分在多重线性回归中应用的共线性诊断方法在logistic回归的共线性诊断方面也同样适用。通过比较各种诊断方法,方差膨胀因子、容许值、特征根分析系统比较适合在医学研究中使用,既操作方便,又能够得到比较全面的结果,便于研究者进一步要采用合适的多重共线性解决方法来降低共线性对方程的危害,以得出正确的结论。
其他文献
线性模型是一类简单且常见的参数回归模型,它以形式简单、可解释性强等优点而备受研究者青睐。同时,部分线性模型是一类极为重要的半参数回归模型。在线性模型的基础上,部分
由于我国农村绝大部分地区尚未建立正式的社会养老保险保障制度,而且随着农村家庭结构改变与村庄生活变迁,传统家庭养老面临着重大挑战,农村老年群体面临老年贫困问题困扰。
无线传感器网络是集传感器技术、微机电技术、现代网络与无线通信技术于一体的综合智能信息处理平台,具有广阔的应用前景,已经引起了人们越来越多的关注。它是由部署在监测区
自1998年3月23日我国证券市场第一批基金(基金开元和基金金泰)的发行拉开基金业发展序幕以来,证券投资基金在我国发展迅猛,特别是2007年,基金资产规模已经突破3万亿元,证券投
目的研究22名正常女大学生月经周期中双手脉象变化与基础体温变化之间的关系,证实临床发现并猜想双手脉象变化规律与正常月经生理之间的联系,为月经周期脉象研究提供基础证明
研究目的:观察针灸调整痰湿体质结合生活方式干预治疗对多囊卵巢综合征患者的临床症状、相关指标的调整效果。研究方法:选择2009年2月-2009年10月于广州中医药大学第一附属医院
耕地质量评价是科学开展退耕还林、评价实施效益的依据,而退耕还林作为山区主要的土地利用变化方式,对不同区域研究具有重要意义.以大田村为例,基于地块尺度以坡度、面积、高
信息化是现代银行发展的生命线。我国银行信息化取得了很大成绩,银行信息化应是技术变革和制度变革有机结合的过程,银行必须在引入现代计算机网络技术的同时,改革现有的决策、业
作风建设是党的建设的重要组成部分。其中领导干部的作风建设是中国共产党作风建设的重中之中。在全面建设小康社会、推进社会主义现代化建设的新的历史时期,加强领导干部作
根据设备的运行状态进行科学合理的维修决策,可以大大提高设备的可利用率并降低维修、调试费用。为了全面准确地反映水电机组运行状态,研究开发高性能的水电机组测试系统具有