基于加权非对称最小二乘回归的联合特征筛选

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:byfa21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,超高维数据在各个领域都得到了井喷式增长,如基因科学,金融学,以及信号处理等方面.在现代统计科学中,此类数据伴随的“维数灾难”问题为建模和分析带来了巨大的考验.在协变量的维数p远大于样本n的情况下,往往只有少数几个变量对响应变量有显著影响,因此统计学家需要在进行变量选择之前,剔除冗余变量,识别出最有影响力的解释变量,从而实现降维的目的.特征筛选方法应运而生,成为统计推断中的重要部分.然而,在收集的过程中,随着维数的累积,数据集会出现异质性问题,协变量间也常存在相关性.因此,提出更加稳健并且可以实现的联合特征筛选的筛选方法异常重要.本文针对数据结构存在相关性的超高维异质性数据的联合特征筛选问题进行了深入研究.本文研究内容共有四章.第一章介绍了特征筛选方法的研究意义以及研究现状,并给出了本论文的研究框架.第二章研究了基于加权非对称最小二乘的联合特征筛选方法.本文首先基于L2E方法计算出了非对称正态分布下的L2E准则,结合非对称最小二乘(ALS)回归,进一步提出了加权非对称最小二乘方法(WALSE).以此作为目标函数,应用IHT算法,提出了考虑协变量之间混合效应的联合特征筛选方法,稀疏加权非对称最小二乘(SWALSE).相较于传统的筛选方法,在进行联合特征筛选的过程中,该方法在数据存在异常值的情况下保持了良好的稳健性.进一步地,通过更改分位数,SWALSE方法可以识别数据的异方差问题.在一定的假设下,本文给出了严格的理论证明,证明了基于SWALSE方法的IHT算法收敛性,以及该方法的确定性筛选性质.第三章进行了数值模拟与实例分析.本文充分考虑数据的相关性结构,异常值问题以及异方差问题,根据四个指标,分析了所提方法的有限样本性质.并在存在异常值和有相关性数据结构的情况下将SWALSE方法与传统方法进行比较,验证了本方法的稳健性与联合筛选.同时在异方差模型下验证了本方法刻画异方差的能力.最后将该方法应用于心脏病微阵列数据集,说明了该方法在实际情况中的应用价值.第四章对本文进行了概括和归纳,并探讨了研究展望.
其他文献
目的:本研究旨在观察比较芒针恢刺激痛点(Trigger Point,TrPs)结合电针及常规电针治疗对慢性非特异性下腰痛(Chronic Non-specific Low Back Pain,CNLBP)疗效的差别,通过评定患者治疗前后视觉模拟评分(Visual Analogue Scale,VAS)、Oswestry 功能障碍指数评分(Oswestry Disability Index,ODI)
学位
转化学习强调突发事件等因素对成人个体意义观点和意义体系的改变,通过检验、批判性反思、质疑等方式帮助其摆脱被扭曲了的意义观点适应新环境。我国当前成人疾病特别是重大疾病发病率较高,为此国家提出健康中国战略、实施健康中国行动。借助转化学习理论有助于帮助成人重疾患者认清患病这一突发事件对其意义观点和意义体系的影响,帮助其适应新环境,形成良性的、摆脱病魔的意义观点和意义体系。除此之外,也有助于帮助成人提高健
学位
目的:通过观察除湿通络活血方对促进CR型全膝关节置换术早期康复的临床观察,分析治疗前后CR型TKA患者早期康复情况,为除湿通络活血方TKA术后运用提供临床依据。方法:本研究选取了 2020年06月至2021年08月期间于苏州市中医医院因膝骨性关节炎行CR型人工全膝关节置换术(TKA)治疗的住院患者作为研究对象,将术后两周手术切口甲级愈合并拆线的患者依据是否予以中药熏洗,随机分成对照组(30例)和实
学位
基于模型不确定性,关于鲁棒最优再保险与投资策略的研究一直是保险精算学领域的热门问题.很多研究在建立模型阶段忽视了历史索赔与未来索赔之间的相关性,鉴于此,在本文的风险模型中,用一个外推偏差衡量索赔的历史相关性.另外,许多文献在研究模糊态度时,仅考虑了极度模糊厌恶这一种情况,这与现实不符.于是本文在相依模型下,考虑复杂的模糊态度,研究了α-鲁棒最优再保险与投资策略.首先,本文在均值方差准则下研究α-鲁
学位
随着科学技术的不断进步,经济社会变得更加繁荣,金融行业也有了很大的发展.保险行业作为金融市场重要组成部分也发展迅速.保险公司和再保险公司已经成为金融体系中不可或缺的部分.一方面,保险公司不仅想获取更多的收益和长远的发展,而且想提高自己的偿付能力.另一方面,随着市场的繁荣发展,保险公司所承接的业务和随之承担的风险也变得越来越多,甚至有地震和台风等自然灾害的情形,保险公司在这些条件下无法承担巨大的索赔
学位
混合式教学是近年来教学理论和教学实践普遍关注的课题,“双减”背景下教育回归学校,更加凸显了混合式教学在提高课堂教学质量中的重要性。2021年2月教育部联合五部门印发的《关于大力加强中小学线上教育教学资源建设与应用意见》中,明确提出要“积极推动线上线下混合教学,拓展教学时空,促进教学组织方式重构和教学方法创新”。混合式教学已成为理论重视、政策倡导、实践必须的教学理念和方式。那么,在目前的小学教育的教
学位
主题班会是国家实施素质教育和核心素养教育的重要途径,是学校落实现德树人根本任务的有效形式,是班主任做好班级管理工作的重要法宝,更是学校培养学生良好的思想道德素质、日常行为习惯和自我教育能力的主要阵地。主题鲜明、形式丰富多样、内容贴近学生实际、环节完整的主题班会,不仅能有效发挥育人功能,而且能形成主题班会的吸引力,增强学生的参与意识和参与积极性。然而,主题班会的实际开展效果并不理想,尤其是在广阔的农
学位
伯恩斯坦的教学话语观产生于“新”教育社会学崛起的大背景之下,植根于涂尔干的结构主义之中,对索绪尔、韩礼德等人的语言学思想精华进行了吸收与继承,是其本人符码理论的进一步发展与具体运用。伯恩斯坦的教学话语观关注教学话语的建构与传递过程,即关注课程知识的选择、分配、组织、传递与习得过程。借助话语研究,伯恩斯坦对教育在文化再生产中的实践方式进行了剖析,揭露了教学实践中蕴含的权力与控制原则。研究与探讨伯恩斯
学位
<正> 巴陵石化公司研究院研制的高纯度、低粘度双酚A型环氧树脂(E—56)于去年底通过了部级鉴定。该树脂具有氯及羟基含量低,粘度低,二缩水甘油醚含量高(≥91%)的特性。每百克树脂中含有环氧值0.55~0.57.有机氯≤0.003、无机氯≤0.0003当量,挥发份≤0.5重量%,粘度4~6Pa·s(25℃)·
期刊
现阶段,我国已完成消除绝对贫困的艰巨任务,解决了区域性整体贫困,但这并非意味着贫困问题的终结,我国农村扶贫开发至此踏上了新征程。党的十九届四中全会首次提出“巩固脱贫攻坚成果,建立解决相对贫困的长效机制”,《国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》也对下一步解决相对贫困问题、实现巩固拓展脱贫攻坚成果同乡村振兴有效衔接做出了全面部署和安排。由此可见,我国农村扶贫开发重心已从消除绝
学位