评估因果分析中的机器学习方法——基于在职培训实验数据

来源 :厦门大学 | 被引量 : 0次 | 上传用户:xw54073601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文结合实验数据和非实验数据来评估应用于因果推断的机器学习相关方法在复制实验结果方面的表现。其中实验数据来自在职培训(Job Training Partnership Act)社会实验,非实验数据则来自符合条件非参与者(Eligible Nonparticipant)数据库。本文所考虑的机器学习相关方法包括基于回归的双机器学习(Double Machine Learning)和基于树的因果森林(Causal Forest),倾向森林(Propensity Forest),以及广义随机森林(Generalized Random Forest)。其中在双机器学习方法下,本文考虑了四种机器学习算法,而对于因果森林以及倾向森林,本文则考虑了四种分裂规则。本文首先结合实验数据中的非处置组和非实验数据中的非参与者组合成复合数据。接着将前文所提到的方法应用于该复合数据得出参与者的平均处置效应,即该方法的估计偏差,此处的偏差值为估计量与真实实验所得处置效应值之差。本文考虑四个子样本,最后通过比较子样本内各种方法所得偏差值来比较其在复制实验结果方面的表现。由于本文所用的数据集中协变量个数较多,本文考虑了协变量少和协变量多两种设定。在协变量少的情况下,作为比较,本文还将相同的评估框架应用于传统的计量方法。本文研究发现:双机器学习估计量在协变量较少和较多情况下都能够较好的重现实验结果。双机器学习估计量在两种设定下的四个子样本中都获得了相对较低的偏差值;除此之外,双机器学习估计量在复制实验结果方面总体上优于传统的回归估计量。另外一方面,因果森林和倾向森林估计量的误差值接近于没有经过任何计量方法调整的简单均值差估计量;广义随机森林估计量所得的误差值则取决于所用的子样本和所包括的协变量。
其他文献
近年来,食品安全问题引发了舆论的广泛关注,消费者对于食品的要求不再只是物美价廉,还有食品安全以及绿色环保的要求。Y公司作为食品行业分销商,目前已将食品质量安全升级作为企业的战略目标,打造食品行业“绿色竞争力”作为企业发展方向。而通过对Y公司的供应商评价与选择决策方式地调研,发现其在供应商选择过程中存在指标体系不全面、食品供应商评价选择过于主观、权重设置不合理的问题,已不能完全适应企业当前发展需要,
学位
随着我国经济增速放缓,经济发展进入“新常态”,国内电力供应将长期处于“总体宽松,局部过剩”的状态,核电业主面临电量、电价“双降”的艰难局面;由于核电建设周期长、投资规模大、政府监管严、市场垄断、设备产能供求矛盾等因素,国内核电项目建设成本一直居高不下,2008年以来国内大量核电建设工程造价经验没有进行很好总结,核电工程造价机制未能真正形成,存在一些行政干预,造成核电经济性上重视不足。鉴于国内核电项
学位
供应链金融的规范发展,有利于拓宽中小企业的融资渠道,促进信贷资源与产业需求匹配,促进产业转型升级。当前国家积极推进供应链创新与应用,其广阔的市场前景吸引着商业银行加大对供应链金融的研究与发展力度。供应链金融业务模式主要包括应收账款融资、存货融资、预付款融资,业务流程涉及主体多、环节多决定着面临的风险具有复杂性、传递性、多变性。区块链技术具有去中心化、去中介信任、信息不篡改、可编程等特点,在解决当前
学位
随着我国提速降费的政策实施,通信运营商之间的竞争愈加激烈,更加关注自身的服务型功能的提升,通信运营商已经从传统的门店等客上门的卡号销售营销模式,转变为线上线下精准服务型营销模式。通过不断提升精准营销能力是公司降低成本持续发展的有力手段,也是公司差异化营销、提升营销效率的关键。论文以F电信公司的精准营销流程为分析对象,首先对当前精准营销流程现状进行分析。其次,结合流程优化理论和客户关系管理系统,分析
学位
近年来,世界经济面对巨大的不确定性,特朗普政府发动的在全世界范围的贸易战还没结束,又爆发了席卷全球的新冠疫情。证券市场作为经济发展的“晴雨表”也受到巨大的影响,无论是其监管者还是交易者都迫切需要科学的方法预测市场走势以作为管理决策参考依据。在这个背景下,综合评估了几个重要证券市场后,本文选择了合理性和投资价值均较好的恒生指数进行预测研究及分析。随着人工智能时代的到来和量化投资的兴起,本文尝试使用神
学位
2020年是网约车进入中国的第十个年头,这种出行方式已逐渐被人们接受且习惯,截至3月,网约车用户规模已达到3.62亿,取得经营许可的网约车平台公司也有140多家,全国合法网约驾驶员已达150多万人,日均完成网约车订单超过2000万单。网约车的增长模式已基本稳定,发展速度放缓。随着网约车合规化进程的发展,网约车企业传统“单一”平台模式的弊端越来越明显,网约车企业们纷纷寻找新的业务模式,以求在激烈的竞
学位
VTC技术有限公司是一家集设计、研发、生产、销售、服务为一体的生产企业,为客户提供网络能源产品及对应的解决方案,主要产品包括机房电源、空调、监控等,服务范围主要包括通信、数据中心、工业和商业。近年来,随着信息技术的不断升级,信息安全越来越受到各企业的重视,各大中型企业都开始新建自己的数据机房和通讯内网,这也吸引了大批供应商进入网络能源行业。由于技术不断推陈出新,市场竞争日益激烈,网络能源行业正在整
学位
本文研究目标是在高维的设定下检验多因子模型中因子的有效性。为了减少机器学习对参数估计造成的正则化偏差以及过拟合偏差,本文在随机折现因子定价模型中运用双重机器学习的方法系统性地对高维因子完成逐个循环检验,本文考虑了资产定价因子之间存在的线性或非线性关系,这可能对因子有效性检验产生偏差。接着,本文进行了大量的蒙特卡洛模拟验证了合适的双重机器学习方法能够纠正这一偏差,从而有利于得到准确的统计推断。在实际
学位
在智慧旅游大发展的背景下,如何推动智慧酒店的健康有序的发展,不仅关系到酒店行业自身的转型升级问题,很大程度上还决定着智慧旅游的发展程度。目前,智慧酒店的建设的模式还不成熟,缺乏标准和体系。此外,智慧酒店在发展过程中存在一定的现实问题,因此建立一个完善的智慧酒店评价体系是非常必要的,为推进智慧酒店的发展提供理论支持。本文运用层次分析法建立一套完善的智慧酒店评价体系,并通过问卷形式调查智慧酒店对于顾客
学位
近年来,装配式混凝土建筑如雨后春笋般在全国多个试点城市发展起来。这一现象的呈现,除了得益于装配式建筑较传统现浇建筑具有的优点外,更大程度上得益于政府部门出台的一系列扶持政策。但是,由于装配式混凝土建筑受到了成本增量等因素的制约,从试点城市向其他城市推广过程并没有预想的顺利。本文以厦门H装配式混凝土住宅为例,通过计算及对比分析得出:控制装配式建筑建安成本增量的关键在于控制PC构件的成本。其后,通过对
学位