基于整合分析的部分线性单指标分位数回归模型

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:Devgame
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,半参数回归模型在统计方法中逐渐盛行,无论是理论研究还是实际应用,都受到了广大学者的关注.部分线性单指标模型(PLSIM)是一种非常重要的高维半参数模型,它能够有效地解决数据高维性问题,并保持良好的可解释性和较广的适应性.目前,关于PLSIM模型的估计方法大多基于均值回归,然而当数据存在异常值、随机误差为异方差或者偏离正态分布时,模型的估计精度则会大大下降.另外,国内外学者关于部分线性单指标模型的研究更多建立在变系数和局部多项式方法上,当变量维度较高、数据量较大时,模型的计算速度则会变得很慢.因此,本文结合分位数回归和半参数方法研究了部分线性单指标分位数回归模型(QPLSIM)及其变量选择,对所建立的模型采取B样条函数逼近,引入MCP惩罚函数,并基于迭代加权最小二乘与单纯形搜索法给出了具体的两阶段估计算法.在一定条件下,本文证明了模型参数估计的渐近正态性与变量选择的oracle性质,并通过数值模拟和实证分析验证了所提方法的有效性,在保证准确率的同时,大大提高了模型的计算速度.此外,数据往往是由来源、格式或主体不同的数据集合并而成,且呈现出高维性和稀疏性.基于多个数据集,如何建立合适的统计方法来挖掘不同子样本之间的同质性与异质性,并实现降维去噪是大数据分析所面临的重大挑战之一.整合分析能够同时考虑多个数据集,避免因时间、地域等因素所引起的模型不稳定问题,是研究数据差异性的有效方法.它将每个协变量在所有数据集中的系数视为同一组,引入惩罚函数对系数组进行双层压缩,研究变量间的关联性并实现降维.因此,本文在QPLSIM模型的基础上继续深入研究,提出了基于整合分析的部分线性单指标分位数回归模型(IAQPLSIM).针对异构数据,本文采用了同时考虑组内与组间变量选择的复合惩罚函数(Composite MCP),在一定条件下证明了模型变量选择的oracle性质,并通过数值模拟和实证分析验证了所提方法的有效性.最后,将IAQPLSIM模型与QPLSIM模型的结果进行比较,发现前者的估计精度和变量选择准确率更高,模型的拟合效果更好。
其他文献
“无事可表”是现在学生在写作时普遍遇到的问题,文章通过提出培养学生敏锐观察力的方法,帮助学生有效的积累写作素材。提高学生的写作水平。 “There is no problem to be
煤粉锅炉运行过程中因种种原因水冷壁及喷口附近会出现结焦现象,结焦会严重危害锅炉运行的安全性和经济性,针对不同部位结焦形成的原因而采取相应对策及措施。可以有效防止结焦
目的:分析复发性阿弗他溃疡(RAU)患者血中微量元素钙的含量。方法:收集RAU组和健康对照组病例各60例,采集静脉血后经原子吸收光谱法进行分析,检测所有样本中钙、锌、铁、铜、
吸气式高超声速飞行器是当前航空航天领域研究的热点,该类飞行器通常使用超燃冲压发动机作为推进系统,并采用一体化设计方案,带来了一系列的气动弹性问题。首先阐述了吸气式
浆果中富含多种活性物质,具显著的医疗和保健功效。新鲜浆果质地柔软,含水率高达90%,易发生腐烂变质,贮藏较为困难。干燥是延长农产品贮藏期和增加产品种类的有效方式,将浆果
石斛类是名贵的中药材,又是观赏价值最高的四大附生观赏兰花之一。本文对湖南石斛属的分类学、地理分布和区系特点以及开发利用等方面进行了研究。
以车桑子(Dodonaea viscose(L.)Jacq)种子为实验材料,置入光照气候箱实培养,研究不同浸种方式(40℃温水、0.3%高锰酸钾溶液、不浸种)、温度处理(15、20、25、30℃恒温和18~25℃变温)和贮藏
目的探讨血栓弹力图(TEG)联合常规凝血试验在乙型肝炎患者精确成分血液输注中的应用价值。方法选取2015年2月至2017年2月濮阳市油田总医院收治的114例乙型肝炎患者,均接受TEG
幼儿晨间活动对于幼儿的成长具有不可忽视的意义和价值,它对于幼儿身体的强健、良好情绪的保持、动作的协调、良好习惯的养成都有极大促进作用。可以说,幼儿的晨间活动是一日
目的探讨血栓弹力图(TEG)在指导肝癌患者术后临床输血中的意义。方法将82名术后凝血功能异常的肝癌患者随机分为2组:依据凝血4项和血小板计数结果指导临床输血者设为对照组,