因果推断中的GAN技术及应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jzl_root2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来关于因果推断的研究在持续发展,并在自然科学、社会科学等领域得到充分实践。由于传统因果推断模型在现实应用中存在许多不足,如倾向得分匹配(PSM)模型是以大样本为基础的,在样本量较小的情况下,通过PSM也仍然会存在部分协变量不平衡的情况,因此PSM模型无法给出有效的因果推断。目前有部分机器学习领域的学者提出一些结合生成式对抗网络(GAN)的因果推断方法,以优化PSM模型的表现。本文在PSM基础上提出结合GAN的一个新模型——GPSM模型。模型核心在于:通过GAN学习原有数据集的分布,生成更多分布相似的样本,结合原有样本和生成样本进行倾向得分匹配,从而解决传统PSM模型在小样本情况下的局限性,控制选择性误差。GPSM模型主要由两个子模型组成:第一个子模型是基于GAN的样本生成模型。由两个神经网络组成,分别为生成器G和判别器D。通过生成器和判别器的相互对抗学习,生成新的模拟样本,从而拓展样本的数量。该子模型的输出与真实样本数据结合,作为第二个子模型的输入。第二个子模型是基于PSM的样本匹配模型。该模型通过Logistic回归计算各个样本的倾向得分,并利用倾向得分将处理组与对照组之间具有相同特征的样本进行匹配,即将处理组对象的反事实状态近似为匹配的对照组对象,并通过对比两者的目标结果差异来对处理的因果效应进行评估。本文最后以某肾病试验药的有效性证明为实验背景,对GPSM模型进行实证分析。利用本文提出的GPSM模型评估试验药对肾病治疗效果的影响,并对比GPSM模型与传统PSM模型的因果推断过程和结果。根据平均处理效应的估计量及假设检验结果,认为该试验药对于治疗有显著作用。实证表明GPSM模型的协变量平衡性、模型稳健性均优于传统PSM模型,并且随着引用的生成样本量越多,GPSM模型的综合表现越好。
其他文献
2012年3月26日,美国笔会,福克纳基金会宣布,美籍日裔女作家大冢朱莉(Julie Otsuka)获得本年度国际笔会/福克纳小说奖,获奖小说为《阁楼上的佛像》(The Buddha in the Attic,2011)。
<正>"监管"是一种政府行政执法行为,即政府在经济领域依法行政的各种举措和行动。政府市场监管是指政府针对企业生产和市场交易建立规则和实施行政执法。监管对象包括参与市
实验一首发精神分裂症患者药物治疗后脑功能网络拓扑学参数变化研究目的:探讨首发精神分裂症患者接受二代抗精神病药物治疗后脑全局拓扑学属性以及局部功能连接的改变。方法:
东莨菪碱(scopolamine,SCOP)是一种M胆碱能受体阻滞剂,能透过血脑屏障,中枢作用较强。近年来研究发现SCOP可影响正常人及Alzheimer氏痴呆(AD)患者的脑电活动和认知功能。但是将SCOP用于评价非AD的脑疾病患者认知功能的研究
当前,我国已逐步发展成为制造业大国,制造业作为国民经济的中流砥柱,在我国市场环境中处于重要的地位。在现行的市场环境下,我国制造业企业面临着巨大的压力和挑战,产能过剩,
《尚书》作为儒家重要经典之一,历来受统治者重视。在《尚书》学传承与发展史上,千乘欧阳氏家族做出了重大的历史贡献,由欧阳生到欧阳歙代传《尚书》经学,形成历史上有名的欧
论述了语篇新、旧信息的相关性及由新、旧信息交替所构成的语篇信息结构推进模式,并从认知理论的角度,探讨了语言教学实践中语篇的输入、输出与语篇信息推进结构的呼应关系,
目的:研究院内制剂强筋祛湿液药效与安全性,以期为保证其临床应用安全与阐明药效提供科学依据。方法:最大给药量法考察强筋祛湿液家兔皮肤涂抹急性毒性;建立二甲苯致小鼠急性
一、市场信用指数研究综述当前,市场主体数量快速增长,市场活跃度不断提升,全社会信息量爆炸式增长,数量巨大、来源分散、格式多样的大数据对政府服务和监管能力提出了新的挑
1病历介绍患者,女,35岁。主因“腰骶及双髋关节疼痛6年”入院。患者6年前生育后出现腰骶部疼痛,未在意,渐出现双髋关节、双侧腹股沟、腰背部、双足跟疼痛。5年前就诊于山西某医院