Spearman相关系数的变量筛选方法

被引量 : 44次 | 上传用户:kitty1973
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,高维数据在科学研究各方面越来越普遍,例如在基因遗传学,金融,图像处理等方面普遍存在着高维数据.由于现有模型或者方法不能有效处理超高维数据,因此需要对超高维数据进行一定的降维,以便能够利用现有模型或者方法进行处理,因而变量筛选或者选择是分析和处理高维数据的关键一步.本论文的研究工作主要有以下两个方面:1.首先指出了传统变量选择方法面对高维数据的不足,并给出了传统变量选择方法的统一形式.然后详细介绍了两种高维数据变量筛选方法:SIS(sure independent screening)方法和RRCS(robust rank correlation screening)方法,最后介绍了其它高维数据变量筛选方法的研究现状.2.对三种常见相关系数进行系统全面的比较和总结,并提出一种基于Spearman相关系数的变量筛选方法,它是基于Pearson相关系数的SIS方法与基于Kendallτ相关系数的RRCS方法的有力补充与完善.Spearman变量筛选方法相比SIS方法具有以下三方面的优势:(1)在更弱的条件下,能够使得确定性筛选性质(sure screening property)成立;(2)Spearman变量筛选方法能够处理除了线性模型外更广泛的模型(如转移模型)的变量筛选问题;(3)示性函数,U-统计量以及Copula理论的引入使得证明过程大大简化.第3章给出数值模拟研究,相比于SIS方法和RRCS方法,在线性模型下有着相差不大的良好表现,在非线性模型下有着更好的表现.最后给出了Spearman变量筛选方法的结论,概述本论文所获得的主要研究成果,并指出进一步的研究问题和方向.
其他文献
面临动态的内外部环境,旅游企业经营困难。有学者指出合作营销是旅游企业经营的成功之道,但旅游企业的合作营销实践表明旅游企业面临着新的风险。文章分析了旅游企业进行合作
两足机器人具备着与人体相似的的身体结构,具有其他类别机器人不能比拟的高度仿人特性。研究两足机器人的最终目的就是让两足机器人代替人类去完成不愿完成的工作。两足机器
本文提出了在醋酸-醋酸钠-酒石酸钾钠介质中连续测定天然水中铋、铜、铅、镉、锌、锰的微分阳极溶出伏安法。研究了底液的组成和波峰的性质,试验了共存元素的允许量。方法灵敏度
乡绅是中国传统乡村社会公共权力结构中的真正主导者,这一社会阶层处于国家与乡村社会之间,发挥着重要的调节器作用,并反映了一种独特的国家与社会关系。国内外学界长期致力
股权激励是上市公司的一种长期激励机制。国有控股上市公司推行股权激励,对于进一步调动国有控股公司上市公司高级管理人员的积极性等具有积极意义。文章主要就如何完善国有
毛细支气管炎是一种婴幼儿较常见的下呼吸道感染性疾病,发病机制与多种细胞因子参与引起的免疫反应有关。而Notch信号通路近年来在肺部疾病的发病机制中也受到了广泛的关注,
<正> 多元文学格局已经形成邱华栋:刘老师,我记得在去年的一次文学讨论会上,听你谈到当前的文学“已经形成了多种美学圈,并互相切割”,也就是说,中国当代文学的多元格局是否
通过对高新技术带动西部传统产业发展现状和存在问题的分析,提出相应的对策,以加快高新技术带动西部传统产业发展的进程,促进西部经济实现跨越式发展。对缩小东西部发展差距,
古村落型世界遗产地的保护与旅游发展的均衡关系一直倍受关注。文章通过对皖南古村落西递、宏村旅游开发历程、现状深入的调查,对西递、宏村两种旅游开发模式下的经济、社会
按照经济学理论,任何使用土地和建设行为都有动机,非公共利益主体的动机是寻求个体自身的最大利益。但由于外在性的存在,个体利益部门对公共物品的供应和共有资源的配置是低