基于变分编码机的因果效应估计

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:ujrcji54937
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据技术的不断发展,人们探索了许多用于挖掘这些数据的算法。但是它们大多局限于挖掘数据中的关联关系,而没有深入理解数据中的因果关系,所以常常会导致一些错误的结论。这种错误往往是不可预估的,也是十分危险的,尤其是在医学领域或者商业决策。基于关联关系挖掘的人工智能算法存在这样的不可避免的缺陷,富有远见的学者们早已开始了因果分析的研究,并且他们认为这才是通往强人工智能的正确之路。目前因果分析主要包括两大部分,因果关系网络发现和因果效应估计,前者是后者的理论基础,后者是前者的应用与验证。传统的因果网络发现方法很容易出现等价类的难题,也就是存在局部不可判别的因果方向。它们只能较好地识别V结构,对于d分离的结构无法区分,所以两变量的因果方向判别方法引起了人们的关注。目前的两变量的因果方向判别方法大多基于噪声独立性假设。这种方法使用核估计来实现噪声独立性的判别,但是这会导致大样本的数据计算量急剧增加,同时核估计方法也很容易对噪声独立性错误判断。为了突破加性噪声假设的限制,本人开始研究异方差数据的因果方向判别,目前研究这种场景的算法还比较少。异方差数据研究的难点在并非所有的异方差系统都具备因果方向可识别性,只能进一步通过合理假设挖掘出具备可识别性的异方差系统。通过研究,本人发现四阶矩是一种很好的度量异方差噪声特性的工具,并且以此建立了一套异方差数据因果方向判别的框架。本算法的创新点在于借助变分异方差高斯过程能够降低计算复杂度,同时四阶矩理论突破了噪声独立性假设,把因果方向判别算法的适用范围进一步扩大。本人还在理论上证明了模型可以退化到噪声独立假设的场景,这表明算法具备一般的适用性。实验的分析的结果也表明本文的方法是有成效的。因果效应估计是建立在因果网络发现的基础之上的研究,它的目的是估计某一种特定的因果关系网络之中因变量对于果变量的影响程度大小。因果效应估计在现实场景具有广泛的应用,例如药物治疗,社会科学等。传统的因果效应估计方法大多基于简单的线性模型或者逻辑回归作为拟合模型,所以常常只能适用于低维小样本的数据,在处理高维海量的数据时表现不佳,而后者是大数据时代不可避免的问题。随着深度学习算法的快速发展,它在处理高维海量的成效令人瞩目,这让我们看到了它们之间结合的可能性。本人发现基于变分编码机模型可以很好地分离与因果效应真正起效的隐变量,某种意义上实现了高维数据信息分离提取的作用。在正确分离隐变量的基础上,再结合传统的倾向评分法就可以较好地解决高维的因果效应估计问题。本方法的创新点在于结合流式的变分编码机与传统的倾向评分法成功地解决高维的带隐变量的因果效应估计问题。实验结果也表明模型在平均因果效应估计上取得了很好的效果。本文的工作分析了因果分析从理论到应用的过程的难点,解决实际应用遇到的异方差和高维数据等问题,完成了因果关系发现到因果效应估计的完整理论框架。
其他文献
弹性超材料可被应用于吸声隔振、亚波长聚焦超透镜、波导、热能控制以及隐身斗篷等先进工程领域。可调弹性超材料的发展拓宽了传统弹性超材料的应用范围,使其能够适应于更广泛的工作频率环境。然而,目前关于可调弹性超材料的研究存在调节机制复杂、调节结果单一的问题,且难以实现局域精确调节。这些问题一方面增加了可调弹性超材料的制造难度,另一方面影响了超材料调节的可控性。本文提出了一种磁控调节机制,并基于该调节机制设
相变诱发塑性钢(Transformation-induced plasticity)具有优良的综合力学性能,是第三代钢铁材料研究的热点。TRIP钢优良的性能主要归因于组织中各相的共同作用,特别是组织中的残余奥氏体,通过改变热处理工艺将更多的残余奥氏体保留下来是获得性能更加优良的TRIP钢的关键。本文中实验钢的初始组织为预淬火得到的马氏体,在双相区退火和完全奥氏体化后不同温度等温淬火处理,利用光学显
举报权是一项重要政治权利,亦是公民对行政机关监督的重要方式。随着经济社会的发展,公民法律意识的提高,行政机关所接受的举报数量如雨后春笋般地快速增长,实践中逐渐涌现出
本课题组早期合成了一系列的大黄素、芦荟大黄素长碳链季铵(鏻)盐,发现这些亲脂性阳离子比传统的亲脂性阳离子,如罗丹明等,显现出更好的抗癌活性。原因是它们不但可以像罗丹明一样富集于癌细胞线粒体,还因为含有醌式结构,可以捕获线粒体呼吸链泄漏的电子并转移给氧气形成活性氧(ROS)。ROS可通过多种方式损害癌细胞线粒体功能,从而破坏癌细胞的线粒体供能途径。著名的Warburg effect指出:癌细胞即使在
随着物联网时代的到来以及5G通信技术的发展,对高速高精度模数转换器(ADC)提出了更高的性能要求。传统的流水线ADC虽然能够实现高速高精度,但需要多个级间余量放大器,导致其
锂硫电池具有高理论比容量(1675 mAh g-1)和高理论能量密度(2600 Wh kg-1),是目前商品化锂离子电池的10倍,且单质硫作为其正极材料具有原料易得、绿色环保、成本低等优点,被认为是最具发展前景的高能量密度二次电池体系之一。但由于活性材料硫和反应产物硫化锂的电子绝缘性,以及反应中间产物多硫化物易溶于电解液而产生“穿梭效应”,严重影响了锂硫电池的电化学性能。因此,本文从抑制多硫化物的
安全计算机是列控系统的核心设备,目前安全计算机广泛采用的是二乘二取二和三取二两种冗余结构。随着计算机、通信与信息处理等技术的快速发展,为进一步提高可靠性,保障列控系统的安全运行,采用二乘三取二冗余结构的安全计算机已经投入了实际应用。本文以二乘三取二结构的双机热备安全计算机系统为研究对象,开展了切换机制研究。在分析二乘三取二的系统结构和工作原理的基础上,重点对二乘三取二双机热备切换过程中同步机制、故
用能评估与诊断是对能耗的使用情况进行评价,识别出用能异常情况,对节能优化有着重要意义,对节能管理工作的开展有着指导价值。作为常见的暖通空调,对多联机系统进行用能评估与诊断对优化多联机性能、建筑节能、提高能源效率有着重大意义,基于数据驱动的用能评估与诊断方法具有运算快速、准确率高等优点,有着较大的应用和推广价值。本文针对多联机系统进行用能评估与诊断,对多联机正常实验工况下的用能正常数据集进行预处理,
新时代是奋斗者的时代,爱国奋斗精神是新时代的主旋律。大学生是国家和民族宝贵的人才资源,其爱国奋斗精神的培育,对于建功立业新时代、实现中华民族伟大复兴的中国梦,有较高
太赫兹波是指0.1 THz到10 THz频带内的电磁波,它处于从宏观经典理论到微量子论以及从电子学到光子学的过渡区域。太赫兹波具有卓越的物理特性,已经在医疗、安检等领域广泛使