Logistic回归中的变量选择方法比较分析

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:flyinghdl1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Logistic回归模型是在医药业、金融业、制造业等行业中应用十分广泛的一种广义线性回归模型,响应变量Y的取值范围为{0,1},常作为分类器进行预测与判别分析。本文首先对Logistic回归的理论模型进行了介绍。在构建Logistic回归模型时,当预测变量的维数较大时,常需要进行变量选择来得到精确度较高与较稀疏的模型。逐步回归法、向前选择法、向后剔除法、Lasso方法和Elastic net方法是实际问题中适用范围较广的变量选择方法。本文对这五种变量选择方法应用于Logistic回归模型时的方法原理与步骤过程进行系统的介绍与分析。本文通过设置在较小、中等和较大样本量这三种情况下的模拟研究,对这五种变量选择方法在预测变量之间的相关性发生变化时的预测分类效果与特点进行比较分析。可发现在样本量较小且相关系数较小时,三种逐步选择方法在特异度上表现相同,向前选择与逐步回归在灵敏度上表现一致,Lasso的表现略优于Elastic net;在较大时,Elastic net的表现较为稳定且较好,向后剔除与逐步回归在灵敏度与特异度上表现一致。在中等样本量时,当接近0或接近1时,Lasso与Elastic net在各预测指标上表现较好。在样本量较大时,五种变量选择方法在各个预测指标上变动幅度与取值范围进一步减小,在AUC与准确度上取值逐渐趋于平稳。在三种样本量中,Lasso与Elastic net在灵敏度与特异度上比三种逐步选择的方法变化幅度小,相对较稳定。本文对我国制造业上市公司的财务预警问题进行研究分析,当某上市公司出现最近两年连续亏损等财务状况异常的情况时,将会被证券交易所对其进行特别处理(Special Treatment,ST)。本文收集了我国2003年至2021年期间制造业上市公司所公示的各季度财务报表,将上市公司是否首次被ST作为响应变量Y,若已被首次ST则Y取值为1。选取了财务报表中的一些重要指标作为预测变量来构建Logistic回归模型,分别运用这五种变量选择方法,对所得模型在参数估计结果与预测效果两方面上的表现特点进行比较分析。
其他文献
新冠肺炎疫情(COVID-19)正在全球蔓延,严重危害了世界人民的生命健康,给全球公共卫生安全带来了巨大挑战.COVID-19是由一种新型的冠状病毒感染所导致的呼吸道传染病,主要通过与自由感染者的密切接触进行传播.通过建立传染病动力学模型可以对疾病的流行规律定量研究,从而预测疫情的走势,分析病毒的传播能力,寻求防治疾病的策略.考虑到传染病在传播过程中不可避免地受到气候的季节性变化和环境白噪声的影响
学位
以CNKI核心论文数据库中的文献为研究对象,梳理网络意识形态安全相关研究成果,可以发现,目前学界对网络意识形态安全的研究成果多以理论分析为主,研究范式上注重宏观和微观相结合,部分研究成果缺乏精准性和针对性,实证分析较少,研究方法单一,缺乏多学科融合视角。因此,未来应该深化研究内容,拓宽研究视角,构建研究话语,提高研究水平和增加理论供给。
期刊
本文研究了带有化疗的随机肿瘤免疫模型的动力学行为.首先我们研究了受白噪声驱动的肿瘤免疫化疗模型.通过建立适当的Lyapunov函数,我们得到了模型全局正解的存在唯一性,并且得到了解的随机最终有界性和随机持久性的充分条件.接着我们通过应用合适的辅助方程,证明了均值持久性.并结合比较定理和遍历性定理,讨论了肿瘤细胞的灭绝性.其次,我们建立了带有脉冲治疗的非自治的随机肿瘤免疫化疗模型,证明了全局正解的存
学位
共位群内捕食系统同时包含捕食与竞争两种相互作用关系.对于捕食关系,人们一直关注物种间的直接相互作用而忽略了恐惧效应这一间接作用.但是很多研究表明,恐惧效应普遍存在,并且能够影响种群的繁殖率和捕食活动.本文基于Holling时间预算方法建立一类包含恐惧效应的共位群内捕食模型.理论上,运用定性分析的方法,给出了平衡点的存在性和稳定性条件,并分析了Hopf分支的存在性.数值上,利用Matlab软件展现了
学位
医院作为一个以提供技术性服务为主体的行业,除了要有过硬的医疗技术能力外,提供优质的服务也是提升医院综合能力的必要条件。树立"以病人为中心"的服务理念,能够有效地提高医院的服务水平,是工作中的重点。文章通过满意度调查活动,查找存在的问题,分析原因并提出改进措施,为病人提供高质量的服务,在激烈的市场竞争中创建和谐社区环境,促进医院健康发展。
期刊
该论文主要研究如下一类二阶变系数微分方程(σ(t)u’(t))’=f(t,u(t))的周期解、有界解与无界解,其中f∈K(R×R;R)为Carathéodory函数,关于t是ω周期的,σ(t)∈AC1([,ω])是正的ω周期函数.首先,通过上下解方法,应用Socrza-Dragoni引理证明了周期解的存在性.然后,利用函数的次线性性质和比较定理得到了最大周期解的存在性.最后,在此基础上,给出了有界
学位
基于结核病传播的两种致病机制:直接发展为结核病(快速)和内源性再激活(缓慢),本文研究了如下的在非局部扩散下具有快慢进展的结核病模型(?)行波解的存在性.在空间扩散的基础上,进一步引入了非局部卷积算子来刻画空间中大范围的结核病扩散现象,得到了系统R0>1且c>c*时在全空间上行波解的存在性,即此时,结核病会成为一种地方病.首先通过基本计算得到系统的无病平衡点和地方病平衡点,分析线性化系统特征矩阵的
学位
教师信念对课程改革起着推动作用,随着课程改革的不断深入开展,教师信念研究成为教师教育研究中的一个重要研究领域。对待错误的信念研究也是信念研究的主要内容之一,然而目前国内外关于教师对待错误的信念研究较少。本研究旨在调查国内中小学数学教师对待错误的信念的状况,为我国中小学数学教师对待错误的信念的培养提供策略。本研究结合国内中小学数学教师的教学环境,改编了国外学者Rybowiak(1999)开发的测量对
学位
本论文研究二维周期区域T2上的无量纲旋转浅水方程组当Rossby数和Froude数以不同的速率趋近零时的三尺度奇异极限.首先通过能量估计得到旋转浅水方程组光滑解的一致估计;然后在此基础上利用紧性方法严格证明了初始值为“好始值”情形的旋转浅水方程组的三尺度奇异极限,并得到其收敛速率;最后使用谱分析等方法严格证明了一般始值情形的三尺度奇异极限.
学位
如今随着时代的变迁和科技的发展,利用计算机将传统的测验方式提升到智能化的新高度已渐渐成为了一个趋势。其中,基于计算机自适应测验(Computerized Adaptive Testing)而衍生的多维计算机自适应测验(Multidimensional Computerized Adaptive Testing)受到了广泛的关注,在教育和心理测量等领域愈加发挥着重要的作用。在整个多维计算机自适应测验
学位