超高维纵向数据广义变系数模型的变量筛选

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:xinlingbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纵向数据具有“组间独立,组内相关”的特点,能反映个体间的差异和个体内部的变化,在医学、经济学等众多领域具有不可替代的作用.随着计算科学技术的飞速发展,可获取的数据维数更高且数据结构更复杂.一方面,这将面临着同时处理纵向数据的复杂性和高维数据的计算量大、统计精度以及算法稳定问题,具有一定的挑战,是统计学研究的热点和难点.另一方面,这需要更灵活的模型来拟合复杂数据.同时考虑到广义变系数模型是广义线性模型的一种推广,既具有广义线性模型易解释的优点,又具有非参数估计的稳健性,在实际应用的灵活性更大.虽然高维纵向数据的变量选择问题已有很多文献研究,但关于广义变系数模型下的问题研究较少,特别是在超高维情况.因此,研究超高维纵向数据广义变系数模型的变量筛选问题具有重要的理论意义和实用价值.本文主要研究超高维纵向数据广义变系数模型的变量筛选问题,推广独立数据的确定独立筛选方法,同时考虑纵向数据相关性特点,提出基于广义估计方程的非参数独立筛选方法.该方法的主要思想是先基于协变量和响应变量之间的边际相关性建立边际广义变系数模型,利用非参数方法和广义估计方程进行估计,然后采用确定独立筛选的思想进行变量筛选.在一定的正则条件下,此方法能够得到确定筛选性质,即使在数据相关结构被错误指定.为了降低错选率并提高筛选的有效性,本文进一步结合惩罚方法和迭代的确定独立筛选方法提出迭代算法,并给出详细步骤.本文所提出的方法在三种不同相关结构下进行数值模拟,其模拟结果展示该方法考虑组内相关结构时的筛选和估计性能都比独立结构更优良,也进一步通过实例分析验证了此方法的有效性.
其他文献
股利支付方式的选择是上市公司财务领域一项重要的决策,在我国最常见的股利支付方式主要有三种,即现金股利、股票股利和混合股利,“现金分红比例”具体是指现金股利所占股利
对二阶动态电路的时域分析方法进行了比较详细的研究,得出了在任意激励情况下求解二阶动态电路全响应的计算公式。
本文通过介绍相邻建筑基坑支护技术的QC成果应用,阐述了开展QC活动保证施工质量的可靠性和必要性。
在一个信息爆炸的时代,基于云计算的海量数据挖掘技术很好地满足了用户对于数据库中可理解知识的精准认识。依靠网络资源,云计算提供了一种动态可伸缩的虚拟性资源模式,实现
目的探讨孟鲁斯特纳和复方甲氧那明联合对慢性支气管炎的治疗效果。方法随机将我院收治的200例慢性支气管炎患者分成甲乙两组各100例,分别给予其常规治疗和孟鲁斯特纳联合复
凝聚态物理学家在研究二维电子气的量子霍尔效应时引入拓扑这一数学家用来描述几何形状不受连续变化改变的性质的概念。人们发现在量子霍尔效应中描述系统的拓扑不变量是第一
中国高尔夫的迅速发展带来了市场对高尔夫人才的巨大需求,而高尔夫行业存在大量专业人才的缺口,特别是管理人才。本文通过对高尔夫管理人才供给的分析,并结合北京地区高尔夫
为了完善庭前会议程序,推进以审判为中心的刑事诉讼制度改革,最高人民法院于2017年2月17日发布了《关于全面推进以审判为中心的刑事诉讼制度改革的实施意见》(以下简称为《实
为了构建生动活泼、富有个性的数学课堂,许多教师把创设情境.激发学生的学习兴趣当成数学教学的重头戏.创设情境成为我们小学数学课堂中一道亮丽的风景线。有些教师为了片面追求