带删失协变量的分位数回归模型的经验似然推断及其应用

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:wuyinfei1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
删失数据是指在某种情况下,样本值不能被完全观测到的不完整的数据。它的出现使得数据处理和分析变得复杂。如何选择合适的方法对不完整数据集进行分析始终是数据处理的难题。一种最简易的处理方式就是将删失数据直接剔除,但该方法容易对结果造成较大的偏差。随着对删失数据研究的深入,多重插补法应运而生。Rubin(1977)系统归纳了多重插补法的思想及理论框架,通过模拟的思想实现了不完整数据的多重插补,避免了直接剔除数据造成的信息损失。此外,学术界存在的删失数据研究成果很多都是关于响应变量删失问题的,对协变量删失问题的研究仍处在初级阶段。本文基于国内外相关文献,拟在分位数回归技术和经验似然推断方法的基础上,对协变量中存在的删失数据进行多重插补,并对模型参数进行经验似然推断。首先,基于分位数回归方法估计删失协变量的条件密度,并运用多重插补方法,对协变量中存在的删失数据进行多次填补。随后,在插补后的完整数据集上构造了模型参数的经验似然比统计量,并估计了参数的经验似然置信域。最后,本文对所提出的多重插补方法(IEL)与直接删除删失数据方法(CEL)得到的结果进行对比分析。本文的主要结构如下:前两章主要概述研究背景及国内外研究现状,并对删失分位数回归、多重插补和经验似然等方法进行详细的理论介绍。第三章详细介绍本文所提出来的基于分位数回归的多重插补方法,并探讨了如何构造相应的经验似然置信域。基于以上方法的论述,本文针对同方差和异方差两种线性模型进行了蒙特卡洛模拟研究。运用多重插补方法填补删失数据,并将所得的经验似然平均置信区间长度与直接将删失数据剔除方法得到的平均区间长度进行比较。最后,本文将提出的多重插补方法运用于2007-2008年美国健康和营养数据中,研究C反应蛋白对血压的影响。模拟和实证结果表明,本文所提出的多重插补方法(IEL)比直接将删失数据删除方法(CEL)有更小的标准误差和更短的平均置信区间。因此,相对于传统的删失数据处理方法来说,本文所提出的多重插补方法是有效且可行的。
其他文献
<正> 引言 雅乐自其产生直至东周,一直是统治阶级礼制乐舞的正统。与雅乐相对的是散乐,又称为俗乐。散乐的历史远比雅乐久远,但它一直是一种民间性的艺术,因而,中国戏剧的散
期刊
在当今社会企业想立于不败之地,而推动一个企业科学和谐的发展的工作之一就是要创建精神文明建设,所以创建精神文明工作的重要性不言而喻。文章结合中海油研究总院精神文明创
<正> 1989年秋,也就是大学毕业后的第二个年头,我因公差回到母校,正赶上听王耀华老师讲《中国传统音乐概论》课。课毕,王老师赠给我几本书著资料,其中,就有一本他编著的《中
蚁群算法是受自然界中蚁群搜索食物行为启发而提出的一种智能优化算法,通过介绍蚁群觅食过程中基于信息素的最短路径的搜索策略,来解决AGV小车寻优路径的问题,并通过仿真验证
益津降糖口服液一次或多次给药能显著降低四氧嘧啶糖尿病小鼠、大鼠的血糖 ;有明显的耐糖作用 ;口服后 1h起效 ,2h血糖下降最显著 ,延长到 8h ;显著降低血清胆固醇 (Tc)和甘
以信贷资产和业务为主体是当前我国商业银行经营发展模式的主要特征,信贷营销、风险控制和产品创新关系到商业银行的健康发展。本文在对基层银行调研的基础之上,着重针对商业
在娱乐为王的时代,同质化现象成为综艺节目的发展瓶颈。尤其是在文化呈现井喷状时,未来如何在同质化中求生存,是综艺节目应深思的重点。本文以浙江卫视的《王牌对王牌》为例,
商业银行将在发展低碳经济过程中,包括在节能、减排和清洁能源方面大有作为。商业银行应积极转变和调整业务模式,利用商业银行信贷政策的调控手段,通过信贷供给的杠杆导向作
随着时代的不断发展,科技的不断进步,电视已经成为每一个家庭都拥有的家用电器,电视节目也渐渐成为人们休闲娱乐的重要内容。电视节目的种类很多,而且目前最新的真人秀节目也
本文首先将我国《国家八七扶贫攻坚计划》所列的592个重点贫困县作了划分,即“一带两片”。一带就是中部连续分布型贫困带,两片是指位于中部两侧的东部孤岛状分布贫困片和西部呈裙