面向观察数据因果发现的因果函数模型研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:liongliong577
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学的要义是泛化。我们希望实验室中的实验在其他地方也成立,希望总结的规律在其他场景也能成立。这种对泛化性的追寻正是人们对因果关系的求索。因果关系为我们提供了一种对世界的建模方式,以帮助人们建立更加稳定的不变的预测模型。然而,现有的以深度学习为主的人工智能算法往往聚焦于相关性而非因果性,无法预测诸如干预,反事实等因果效应推断问题。回答因果效应推断问题的关键是建立数据的因果模型。因此,如何在数据中建立因果模型并发现其中因果关系是人工智能的关键。但传统基于随机试验的因果关系发现方法往往受到成本,或道德的约束,已不再适用于当前基于大量观察数据训练的人工智能模型。因此,如何从观测数据中发现因果关系,已成为当前人工智能研究的重要问题。从观察数据发现因果关系的重要方法是因果函数模型(Functional Causal Model,FCM)。得益于其区分马尔科夫等价类的能力,越来越多学者尝试基于因果函数模型来解决因果方向推断与因果网络构建的问题。然而,现有基于因果函数模型的因果方向推断方法在不完全观察数据、离散分类数据、非稳态数据以及高维网络构建中仍存在因果方向可识别性问题。针对以上挑战,本文解决了因果函数模型在不完全观察数据,离散分类数据,以及多领域数据下因果方向推断问题,并推广了因果函数模型使其可用于高维因果网络构建,推动了因果函数模型在开放场景下因果发现能力。本文的主要贡献如下:(1)针对非线性加性噪声模型在不完全观察数据中不具有传递性的挑战,提出了级联加性噪声模型及其含混淆因子的级联加性噪声模型的拓展。模型通过对隐变量建模,结合变分推断的求解框架,实现了在不完全观察数据中的因果方向推断。理论证明了含混淆因子的级联加性噪声模型在已恢复隐变量下的可识别性,指出模型只在严格的条件下,因果方向是不可推断的。生成数据与真实数据均验证了模型的有效性,可有效推断因果方向。(2)针对在多领域场景下的因果方向推断挑战,提出了多领域数据下的因果方向推断算法。算法通过检测因果方向上的因果模块性,即原因分布与条件概率分布(因果机制)变化的独立性,结合多领域数据的特质,将不同领域参数视作计算独立性的样本,实现了多领域数据下的因果方向推断问题。算中,给出了三种不同的衡量原因分布与因果机制依赖性方法,通过比较两个因果方向上的依赖性,并将较为独立的方向推断为因果方向。理论给出了算法不可识别的条件,表明只有在极少情况下模型是不可识别的。生成数据与真实数据中均验证了算法的有效性。(3)针对因果函数模型在离散分类下容易受干扰的挑战,提出了一种基于压缩映射机制的因果模型。模型通过构造确定性压缩与概率性映射两阶段过程,结合基于BIC评分的压缩状态搜索评分,实现了在离散分类数据下的因果方向推断。理论证明了基于压缩映射机制的因果模型在存在压缩状态的场景下往往是可识别的,且理论进一步指出在参数随机化的前提下,模型总是可识别的。生成数据与模型数据中均验证了模型有效性,可找到真实的压缩状态并正确地推断因果方向。(4)针对基于压缩映射机制的因果模型在高维网络构建中的挑战,推广并提出了一种基于压缩映射机制的多变量因果模型。模型通过允许每个直接因果边存在一种压缩映射机制,结合BIC准则推导了因果网络结构评分函数,实现了在分类数据下的因果网络构建。理论证明了基于压缩映射机制的多变量因果模型在多变量下是可识别的。生成数据与真实结构数据中均验证了模型的有效性。(5)针对因果函数模型在高维网络构建中的挑战,提出了基于因果函数似然度嵌入的因果网络构建算法。算法通过将函数因果模型嵌入到似然度中,结合BIC准则推导了因果网络评分,实现了在函数因果模型下的因果网络结构构建。理论证明了最优的因果结构是可识别的。模拟与真实因果结构均验证了算法的正确性。
其他文献
行为决策者在获取信息和处理信息时,需要消耗注意力。注意力是一种短期内不可再生的稀缺资源,在信息爆炸式增长的数字时代,更需要对有限注意力进行合理有效的配置。资本市场上的投资者是一类典型的信息决策者,如何通过有效的注意力配置,从大量的信息中提取有效私人信号,是投资决策者要解决的重要问题。本文在理性疏忽框架下,从理论和实证两个角度,研究了股票市场上投资者面对信息波动时的注意力最优配置问题。本文通过建立注
学位
学位
我国近年来推行的供给侧结构性改革,明确了“三去一降一补”五大任务,即“去产能、去库存、去杠杆、降成本、补短板”。其中,“去产能”系列政策推行力度大、成效显著,对各类型上市公司的影响最为明显,因此,基于“去产能”政策视角,进行供给侧结构性改革的效果与影响研究,具有较强的代表性。通过分析“去产能”政策产生的实际效果,对政策本身的设计合理性、政策落地实施过程中的难点和产生的实际效果进行系统地研究,并聚合
学位
改革开放以来,中国经济发展取得了巨大成就,但区域发展不平衡问题依然较为突出。区域空间发展是增长理论、区域经济学、新经济地理学和可持续发展理论研究长期关注的重要问题。伴随着国内外发展环境的深刻变革以及中国区域经济增长呈现的不平衡状态,有效提升经济增长效率,实现经济增长动力由规模驱动向效率驱动转换是中国经济实现高质量发展的重要任务,而实现规模报酬递增是这一过程中的重要环节之一。中国各区域的规模报酬水平
学位
我国经济已由高速增长阶段转向高质量发展阶段,发展的着力点应立足于科技创新和实体经济国际竞争力的增强。装备制造业作为衡量一国实体经济的支柱型产业,是制造业的核心。尽管我国装备制造业已形成了完整的体系,但是“大而不强”和内在动力不足是当前装备制造业面临的主要瓶颈,而技术自主创新是突破低端锁定、战略阻隔以及促进制造业升级的根本动力,而装备制造业也是实现我国技术自主创新的最前沿领域。作为微观动力的技术创新
学位
农业产业集群是优化区域农业产业布局,实现农业资源优化配置,提升农业产业竞争力的有效组织方式,它所产生的规模经济和溢出效应都有效地促进了农业经济的快速可持续发展。但我国大多数农业产业集群仍处于发展初期,集聚规模小,产业链条短,创新投入和品牌培育不足,农业中介服务组织综合实力不强,如何促进农业产业逐步向产业链高端延伸成为当前亟需解决的问题。本文基于农业产业集群视角,综合运用外源化视角的全球价值链理论、
学位
近年来,随着社会经济的发展,污染问题日益突出,对环境造成损害。如何处理好发展与环境的关系,如何对排污企业进行积极有效的监管,使得在现有发展状态下实现经济与环境协同最优,是政府面临的一大难题。在企业减排背景下,多方利益相关者之间的利益以及矛盾冲突往往是长期的、复杂的,甚至是难以协调的。虽然长期以来我国政府高度重视环境污染治理问题,制定了各种针对生产排污企业的监管机制,出台了大量的政策性文件,但是环境
学位
改革开放以来,中国创造了经济增长奇迹,成为世界第二大经济体,但同时也带来了严重的生态环境问题。因此,如何既保证经济增长又减少对生态环境的破坏,成为中国当前亟待解决的问题之一。京津冀地区作为我国首都经济圈,其协同发展是重大国家战略,有利于促进北方经济增长,也将成为我国经济发展的新引擎。近年来,京津冀地区资源禀赋不足、环境污染和雾霾天气等问题日益凸显,使得生态环境与经济增长协调发展成为了实现京津冀一体
学位
随着制造环境的全球化和用户消费需求个性化的发展,批量定制型生产模式在制造企业中逐步占据重要位置。然而,近年来随着生产制造用工成本的增加和企业对工厂生产过程精细化管理需求的增强,对诸如大型家电、定制家具和3C数码外设产品等传统具有强人工依赖特征的劳动密集型批量定制型装备制造企业的成本控制造成了一定的成本冲击。与此同时,随着国家政策支持以及企业自身发展,车间生产制造系统中加工、运输等相关设备的自动化率
学位
设计可用于解决问题或创造愿景。解决问题,是在现存方案基础之上,通过查漏补缺在“负值空间”中提升质量;创造愿景,是在“正值空间”中识别全新的设计机会,实现突破性创新。论文的研究目的是:强化实现期待、满足愿景的“期望导向”创新逻辑,从解决问题转向创造期待,在“正创造”视角下探索质量期望导向的设计方法。首先,通过对机械工程、设计学、工商管理、心理学等学科的相关研究进行全景扫描,提出论文的三个研究目标:目
学位