超高维生存数据的变量筛选和异常值点识别的研究

来源 :武汉大学 | 被引量 : 3次 | 上传用户:donna1105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文讨论了两个问题:超高维生存数据的变量筛选和指数回归模型中生存数据的异常值点识别.在超高维数据中,确定独立筛选法能以很高概率在保留所有重要变量的前提下快速有效地降低数据的维数.现有的变量筛选方法大多数是针对完全数据提出的,无法处理存在删失的生存数据.本文提出了三种不依赖于模型的变量筛选法来处理超高维生存数据,它们分别是基于删失累积残差、相关性秩排序和Kolmogorov-Smirnov检验统计量.这三种方法在比较弱的正则化条件下拥有确定筛选性(sure screening property)和秩相合性(ranking consistency).模拟实验结果说明这三种方法的表现优于已有的方法.最后我们把它们应用到套细胞淋巴瘤的实例分析中.现实生活中的大部分数据集会存在异常值点,异常值点的存在会对参数估计、统计推断和模型选择带来不利影响.目前对完全观测数据中异常值点的研究已经硕果累累,却很少有人研究带删失的生存数据中的异常值点识别.本文提出惩罚似然的方法来检测指数回归模型中的异常值点,它可以处理带有删失的生存数据.我们把异常值点识别问题转换成高维正则化回归中的参数估计问题,并采用坐标下降法来提高计算效率.此方法的特点是在检测异常值点的同时可以得到回归系数的估计.数值模拟实验和实例分析的结果显示此方法在处理指数回归模型中的异常值点识别和参数估计时非常有效.
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
从激活图书馆员的研究意识、主动服务意识以及信息资源的深层次开发等方面探讨高校图书馆如何激活信息费源服务于研究性学习的问题。
香菇是药食两用的真菌,香菇多糖是其中的活性代表成分。近年来,香菇多糖在免疫功能调节方面的作用成为研究的热点。研究证实香菇多糖通过刺激机体的免疫器官、促进淋巴细胞的
两年前,记者曾对周晓光做过一次专访,并以她办公室正墙上挂着的一个条幅“仁者雍容”为题,概括她在自我修养和待人处事中所达到的境界。
小学中段语文教学是小学教育的重要一环,对培养学生语言感觉意义重大。在中段语文教学中尝试采取读赏式教学,能提高学生对文章语言的理解,让学生沉醉于语言的奇妙之中。另外还能
梵克雅宝(Van Cleef & Arpels)诞生于巴黎,这座神奇之城为品牌的珠宝设计孕育了无尽灵感。2006年,梵克雅宝曾推出一个礼赞光明之城的Une Joumée à Paris“巴黎的一天”
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
以两部六层电梯为控制对象,介绍了电梯双联控制算法的创新设计,根据程序设定的控制规则分配每部电梯应响应的信号,实现对电梯信号的并联控制,克服两部电梯控制系统分单、双层
目的:观察中医理筋正骨手法在慢性踝关节损伤治疗中的作用。方法:将53例单侧慢性踝关节损伤患者随机分为2组,26例采用物理因子疗法联合Kaltenborn关节松动术和功能锻炼治疗(
教学模式实则是指为了落实某种教育思想或理论所形成的教学框架与操作程序,应该协调并突出各个教学因素,由此落实相应的课程目标。在现代教育环境内,初中英语教育领域已经衍