因果推断中条件平均处理效应的估计——基于协变量平衡方法

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:wj34271996
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,因果推断的研究在近二十余年来得到了快速的发展,并逐渐运用于医疗、金融、互联网和社会研究等领域。在观测性研究中运用倾向得分对于条件平均处理效应进行估计一直是因果推断领域的热点,但是基于倾向得分的条件平均处理效应估计常常由于倾向得分的模型设定偏误或者估计偏误而导致的协变量不平衡从而进一步影响估计结果。本文将协变量平衡运用在半参数核方法以及广义随机森林模型中用以提升相应的模型对于条件平均处理效应的估计效果,并且运用数值模拟实验证明了本文提出的协变量平衡方法可以有效提升半参数核方法以及广义随机森林模型在估计条件处理效应时的稳健性并且使之在协变量不平衡的数据分布中依然可以取得较好的估计结果。本文运用基于协变量平衡的广义随机森林算法和半参数核方法分析了北卡罗来纳州生命统计数据中不同年龄阶段的白人孕妇和黑人孕妇的吸烟与否对于新生婴儿体重的条件平均处理效应。运用基于倾向得分的估计方法估计的条件均值处理效应去反映异构性总体中由特定特征维度数值进行划分的不同子集的处理效应是因果推断观测性研究中常常运用的研究分析方法。考虑到参数模型在实际运用中常常会存在模型设定偏误的问题,并且在估计倾向得分过程中还会面临着因协变量不平衡而导致倾向得分估计存在偏误的问题,本文提出了在传统的半参数核方法中引入协变量平衡方法,旨在运用协变量平衡加权方法解决半参数核方法估计条件平均处理效应的过程中的协变量不平衡以及模型误设场景下模型稳健性差的两个问题。基于协变量平衡的半参数核方法运用协变量平衡倾向得分估计倾向得分并通过半参数核方法估计条件均值处理效应。数值模拟实验验证了协变量倾向得分可以在满足基础假设的前提下有效的提升模型在协变量分布不平衡的数据分布场景以及在倾向得分的参数估计模型设定存在误设的情况下的估计效果。广义随机森林算法因为其理论的完备性并且相对其他因果森林类算法有更低的计算花销的优势,在估计条件处理效应的研究中得以广泛利用。同样,在协变量不平衡以及模型被误设的情况下估计条件处理效应会有较大的偏误的全队也制约了广义随机森林算法在实际研究和分析中进一步推广。本文基于该痛点提出了基于协变量平衡的广义随机森林对条件平均处理效应进行估计。基于协变量平衡的广义随机森林的主要贡献在于将公共支撑方法(Overlap)加权处理后的由协变量平衡倾向得分方法估计的倾向得分运用于广义随机森林算法框架之中,意图通过协变量平衡倾向得分和Overlap增加模型的稳健性以解决在协变量不平衡的情况下和模型被误设的情况下条件处理效应估计的问题。数值模拟实验证实在数值不具有异构性时协变量平衡倾向得分和Overlap方法可以增加模型的稳健性并且在协变量不平衡的情况下有着较好的表现,但是在有异构性的数据中,当控制组与实验组的样本比例分布不均匀时,实验结果与本文的最初的设想相违背。最后本文总结了两个创新点以及数值模拟实验及实例分析的结果,同时也分析了本文研究的不足之处以及一些值得进行更加深入研究的研究点。
其他文献
贫困问题早已引起众多国内专家学者的高度注意,学者们已经开始了大量课题研究和开展实践探讨工作,与此同时,新型城镇化亦被外界认为不仅是党的十八大以来我们国家重点组织实施的一项重大社会民生基础工程,也被认为是“新常态”发展条件下,当代中国国民经济社会持续健康稳定发展的重要战略驱动力,我国正值城镇化向国家深度健康发展战略过渡的一个关键时期,为了更好地正确认识和充分看到城镇化对于我国经济社会持续发展的重要意
学位
近年来,我国商业银行正面临着各种挑战,比如外资银行的引入、互联网金融的发展、利率市场化和监管政策的变化等。在金融市场不断深化改革的大背景下,银行所面临的外部冲击以及不断爆发的不良资产、监管模式、管理效率等深层次问题导致了我国银行业存在效率低下的现象。因此,我们展开对银行经营效率的研究,不仅评价各银行效率的高低,也找到影响效率的关键因素,进而改善这些因素来提升其效率,带动银行业往市场化、竞争化方向发
学位
自2013年以来,习近平精准扶贫思想已上升到战略层面,随着学者们对精准扶贫思想内涵的深刻理解,相关研究越来越多。在此基础上,本文以习近平精准扶贫思想为主线,对精准扶贫工作内容进行全面分析,从经济发展进步、社会发展进步、基础设施建设进步、精准扶贫效果四个方面出发,基于2014-2018年我国22个有扶贫任务的省份的指标数据,使用改进的层次分析法、主成分分析法、熵值法三种方法对指标赋权,初步对精准扶贫
学位
改革开放以来,我国经济已迈进整体转型期,深入落实以人为本、全力保障改善民生,不断增强国民幸福感是发展的不二法门。幸福是盛行不衰的话题,人们一切活动的终极目标都在于使自身需求得以满足,获得幸福感。婚姻在社会关系中始终居于重要位置,多数研究一直表明,婚姻状况是主观幸福感最强的人口统计学相关因素之一。一个普遍的共识是:婚姻对幸福有显著的积极影响,已婚人士往往比单身人士更幸福,而单身人士又比丧偶者和离异者
学位
微博,具有互动性强、表达方式多样、内容多元等特点,一经发布便吸引了大批用户,在短短几年时间内用户量便已达到亿级,且仍呈上升趋势,是中国主流的社交媒体之一。不同年龄段、不同领域的用户拓宽了微博数据的信息维度,复杂的社交网络提升了信息的传播速度。微博的上述特点,使其成为信息分享与传播的关键场所,进而积攒了海量数据。如何获取、保存这些数据,并从中提取有价值的信息,是大数据时代的重要课题。主题提取技术用于
学位
追求幸福是人的天性,提升居民幸福感也是国家的重要目标。本文综合考虑宏观和微观因素构建影响居民幸福感的分析指标,在此基础上建模分析,挖掘宏观环境和微观环境中影响居民幸福感的主要因素。不仅可以精准定位低幸福人群,对其进行精准扶持,而且可以基于居民需求对国家的产业与经济重新布局,进而提升居民的满意度和幸福感。围绕居民的幸福感情况,本文开展了以下四个方面的研究:1.综合宏观和微观两方面因素构建分析指标。选
学位
随着文化和信息科技、数字化等现代技术相结合催生出的新兴文化产业的迅速崛起,文化产业呈现出产业发展的新优势。2020年,中共中央明确提出实施文化产业数字化战略,以促进文化产业与相关产业融合作为文化产业未来发展的重点。传统的文化产业不足以适应目前经济社会中人们的精神文化需求,只有新兴文化产业才能推进我国由制造大国向创造大国的转变,我国新兴文化产业发展方兴未艾,前景十分广阔。推进新兴文化产业与相关产业的
学位
不规律的作息习惯和不健康的饮食方式,导致心血管疾病跃居威胁人类健康常见病症的榜首。而从心脏核磁共振成像中精确分割左心室内外膜,是临床上定量分析的必要前提,是进一步诊治心血管疾病的重要步骤。此外带标记线的核磁共振(tagged Magnetic Resonance,tMR)成像还可用于心脏运动追踪。这对及时发现病症并提供针对性治疗有重要现实意义。由于心脏结构的复杂性导致其精确分割仍是一项极具挑战性的
学位
近年来,在聚集信息、资讯发布和舆论传播的过程中,新闻媒体发挥着重要的媒介作用,对资本市场的影响日渐突显。一方面,作为信息供给者,媒体对公司、行业的信息挖掘,给市场参与者带来决策参考和信息补给,另一方面,媒体的商业价值逐渐被挖掘,由媒体商业价值驱使的新闻报道会对信息进行选择性取舍,并在标题和正文中使用引人注目的语言表达,通过其构建的议题框架传递其情绪,影响市场参与者对事件的认知和观点态度,从而进一步
学位
股票市场投资是众所周知的“激进型”投资方式,区别于银行存款、国家债券等传统金融投资方式的稳健,股票市场投资往往存在较高的风险,但对于广大投资者的逐利心理而言,这种门槛低、收益高、简单且直接的投资方式正投其所好,股票市场投资成为了近年来最受大众青睐的投资方式。因此如何更加精准的对股票市场进行预测,帮助专业投资知识匮乏的投资者们防范风险、获取有效信息、获得利益成为了有实际意义的研究课题。互联网时代的到
学位