二分类响应变量模型中的变量选择方法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:zslovechl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变量选择方法是处理高维统计模型的基本方法。现有的变量选择方法主要是子集选择法和系数压缩法。子集选择法包括逐步回归法、向前或向后选择法等一些常用的方法,这种方法在协变量维数p较大时,不仅计算量较大,而且忽略了随机误差。系数压缩法是近些年发展较快的一种方法,其最大的优势在于能同时进行参数估计和变量选择,并能将真值为0的参数准确地估计为0,这种方法同样计算量大,计算速度缓慢,而且在实际问题中也不易操作。注意到,这两种方法均是针对经典线性模型提出的,将它们应用到复杂的模型中还需要进一步的研究。这些分析构成了本文的研究动机。   考虑到现实生活中,我们经常碰到响应变量为属性变量的情形,本文特别针对二分类响应变量模型的变量选择问题进行研究。本文创新性地将模糊集理论应用到二分类响应变量模型的变量选择中,从集合的角度出发,出别于以往的子集选择法和系数压缩法等基于模型的方法,从而针对二分类响应变量模型,创建了直观、易于解释且便于计算的变量选择方法。值得一提的是,该方法具有以下一些优势:①不需要假定模型的具体形式;②在协变量维数p较大甚至是远大于n的情况下,该方法的操作简单易行且有效;③该方法不需要像针对Logistic回归模型的变量选择方法那样,要求协变量为分类变量或对协变量进行离散化处理,亦即,该方法对于协变量类型没有要求。   由于本文所提出的新变量选择方法的表现在很大程度上依赖于隶属函数的选取,本文又针对“隶属函数”进行了探讨,在充分考虑实际问题背景的前提下,以数形结合的方式建立了隶属函数的选取标准以及隶属函数中未知参数的确定方法,与此同时,本文还提出了一类新的中间型隶属函数,以供实际问题选择。一个实际例子的应用揭示了新变量选择方法不仅在操作上简单易行,而且在协变量维数p远大于样本容量n的情形下也极为有效,能迅速地筛选出重要的协变量。
其他文献
设G是一个有n个顶点的简单连通图且di为点vi的度,其中i=1,2,…,n。若vi与vj邻接,则图G的Randic矩阵中第i行,第j列的元素定义为1/√didj,否则定义为0。若L(G)和R(G)分别表示图G的规范
近年来,分数微分方程理论一直是诸多领域比较有价值的应用工具。尤其在数学各方面的应用,分数阶微分方程起到了越来越重要的作用。因此,分数微分方程的研究越来越受到国内外
西方关于企业社会责任对营运绩效影响的研究,往往经由社会责任投资,或者企业治理的市场讯号对投资人或消费者的影响来证实。然而经台湾股票市场长期资料的时间序列分析:整体来看,台湾社会责任标竿企业在股票市场上虽然风险较低,相对报酬却比较片面与个别性。不同时间、产业甚至传统品牌因素都可能造成变异。企业社会责任作为市场投资者风险侦测的预警机制是比较合理的解释,负面标竿的出现突显了正面标竿企业的相对优势。因此相对于西方研究,至少台湾在目前为止,企业社会责任最多可视为特定产业投资人长期风险监控的讯号。
《中国共产党军队委员会工作条例(试行)》中明确规定,党委议事和决策必须贯彻集体领导、民主集中、个别酝酿、会议决定的原则。“个别酝酿”作为“十六字”原则的重要组成部
北师大版九年级数学第二章的一元二次方程中鸡场问题是重点也是难点.如何设,如何验根,如何弄清边的关系是这类题目的关键点.对于这一类的问题的研究可以采用问题串的形式帮助
本文研究了两类二阶混合型非线性微分方程解的振动准则以及一类二阶超前型半线性微分方程解的振动性质,所得结果推广和丰富了现有文献的相关结论.全文共分三章:  第一章为绪
右心室机能障碍是引起先天性心脏病病人心力衰竭的最普遍的原因之一,会导致心脏功能损坏及过早死亡。心肌组织再生的研究致力于再生出活的心肌组织用于替换心脏中的疤痕组织
本文应用李代数上的合成钻石引理得到了整数环Z上的Drinfeld-Kohno李代数Ln的一个Grobner-Shirshov基以及相应的一组Z-基底,应用该基底我们重新证明了如下定理:任何一个Drinfel
学位
学位