【摘 要】
:
人们要认识事物之间的作用机制,使其能够为人类活动服务,就必须要了解不同事物之间的关系,其中因果关系是事物之间普遍存在的一个重要关系,探寻世界中变量间存在的因果关系可以帮助人们更好的认识事物的相互影响。然而,事物之间的关系总是错综复杂的,因果关系并不是显而易见的,在不同领域专家的辅助之下,可以人工对各个领域的系统建立模型,但是在缺乏专家知识的情况下,我们就需要基于一些在生产生活中获取到的观测数据进行
论文部分内容阅读
人们要认识事物之间的作用机制,使其能够为人类活动服务,就必须要了解不同事物之间的关系,其中因果关系是事物之间普遍存在的一个重要关系,探寻世界中变量间存在的因果关系可以帮助人们更好的认识事物的相互影响。然而,事物之间的关系总是错综复杂的,因果关系并不是显而易见的,在不同领域专家的辅助之下,可以人工对各个领域的系统建立模型,但是在缺乏专家知识的情况下,我们就需要基于一些在生产生活中获取到的观测数据进行自动建模。大数据时代的到来使得人们能够获取的信息和数据越来越多,直接从数据中发现因果关系成为可能,但是另一方面,数据中蕴含的信息复杂多样,要从大数据中发现因果关系,还需要一些特殊的技术手段。贝叶斯网络能够直观反映变量之间的相互依赖关系,而且其依赖强度可以通过条件概率分布表来刻画,是一个非常适合用于进行因果发现的模型。本文基于贝叶斯网络进行因果发现,并开发了一个因果推理软件,我们的主要成果包括:(1)基于K2算法进行因果发现本文采用K2算法学习贝叶斯网络,考虑到K2算法学习贝叶斯网络的准确度很大程度上取决于预定义的节点顺序这一特点,我们提出了一种基于节点优先等级的方法对变量节点排序,与随机顺序和MCMC算法直接学习贝叶斯网络相比,1000次重复实验中在三种算法中表现最佳的次数达到580次。同时,本文将该算法应用于美国国内航空的一个航班延误—天气数据集,建立了航班延误与有雾、潮湿、低气压、雨雪、低温、打雷、低能见度这些天气因素之间的因果图结构。(2)基于扰动进行因果发现本文采用结构扰动的方式引入扰动数据,通过迭代的方式学习因果网络。为了找出当前结构下最具有扰动价值的节点,本文提出了一个基于杰卡德相似系数的扰动节点选择方法。该方法通过切断不同节点对子节点的影响,比较其与原来网络生成的样本数据的差异,从而找出对网络中其他节点影响最大的节点,以此节点作为扰动节点,能够达到最佳的扰动效果。在基于包含500个实例的观测数据集中,我们在进行因果发现之后,进行了9次迭代扰动,学习到的贝叶斯网络和真实网络差异的度量分别为7、7、9、8、4、5、9、6、4,整体上呈现一个下降的趋势。(3)因果推理的代码实现建立图形因果模型之后,代码基于do-calculus准则提出变量之间因果关系的假设,然后对假设进行估计,得到因果推断结论,最后通过二次估计对结论进行验证。
其他文献
航天器电磁操控是一种新的在轨服务技术,通过在航天器上安装三个正交的超导线圈产生任意方向的电磁力控制航天器间的相对运动。与传统惯性推力相比,星间电磁力具有无推进剂消耗、连续、可逆、无羽流污染等优点,在对地观测、空间探测等领域有广阔的应用前景。然而,任意两个通电线圈间都会产生电磁力,这使得多航天器电磁操控动力学分析变得异常复杂,针对这一问题,论文设计了电流频率/相位调制方法达到简化目的,基于此,还研究
X射线自由电子激光、红外激光系统作为重要的战略资源,其发展建设对国防具有重要意义。随着应用领域的拓宽和用户需求的提升,对激光系统光束线传输质量、稳定性等指标提出了更高的要求。研究表明,X射线自由电子激光、红外激光系统使役性能与反射镜材料、表面精度、表面质量等有密不可分的联系。单晶硅凭借其优良的理化特性,被广泛用作反射镜基底材料。目前,单晶硅反射镜主要以超精密磨削结合磁流变抛光、离子束修形等组合工艺
随着现代科技成果的引入和大气科学自身的快速发展,天气预报已经从传统的建立在天气学原理、数理统计与预报员经验基础上的定性预报方法,发展以大气探测和大气科学理论为基础、综合运用科学技术新成就、在高性能计算机上实施的现代数值天气预报体系。数值天气预报水平的高低,已经成为衡量一个国家气象业务保障能力的重要标志。准确的数值天气预报必须以高质量初始场为基础。生成初始场数据的资料同化是数值预报的核心关键技术之一
自动问答系统要求机器在阅读由自然语言表述的问题之后给出问题的答案,可以用于衡量机器的智能程度。因此,对于自动问答系统的研究不管是在学术界还是工业界都受到了极大的关注。由于问答系统的知识源包含大量的文档,而这些文档由许多段落组成,因此段落排序技术是问答系统中重要的信息筛选工具,也是自动问答领域的关键性技术。近年来,随着深度学习方法的不断发展以及问答系统与机器阅读理解领域大规模基准数据集的发布,问答系
近年来,随着社会和经济的发展,土地等自然资源的利用价值充分体现出来。由此,一些时间久远、权属不清、界线不明的土地行政争议纠纷逐渐增多,此类案件从实体处理上论证被诉行政行为是否合法难度较大,行政诉讼程序"空转"问题突出。检察机关在办理此类行政生效裁判监督案件中,程序方面应严格按照法律规定认定诉讼主体资格及起诉期限问题;实体方面应坚持依法精准监督、运用多种方式推动实质性化解行政争议。
事件抽取是信息抽取领域内的一项富有挑战性的任务,其目的是从自然语言文本中抽取结构化形式的事件信息。从上世纪末开始,研究者们针对事件抽取任务提出了很多方法和模型,并在当时取得了很好的效果。尽管如此,事件抽取任务的准确率仍然存在很大的提升空间。另一方面,面对事件抽取模型愈发复杂的现状和处理大规模文本的需求,工业界希望能够进一步提升事件抽取的效率。本文面向大规模英文文本事件抽取的关键技术进行了深入研究,
生物种群中存在着令人震撼的运动场景,如欧洲椋鸟的“空中芭蕾”、海洋鱼群的聚集洄游等.科学家们从理论建模角度来理解和解释生物群集行为,积累了丰富的研究成果并已广泛应用于无人机编队以及无人机集群作战等群体智能系统中.在实践过程中,一些现实问题值得思考,比如,群体内部避碰、时间延迟的影响以及具有领导群体的一致性问题等.本文围绕上述问题开展如下几个工作:1.针对多粒子群行为演化过程中免碰撞集群问题,研究了
近年来,越来越多的机器人问题开始探索基于深度学习的解决途径。然而,深度神经网络能力的提升往往伴随着模型规模和复杂度的增加,需要在运行时消耗大量资源。而作为一类特殊的计算设备,机器人由于物理设计约束,其上资源往往是受限的。二者之间的矛盾已经成为制约机器人自主性和智能化水平提升的瓶颈问题。在分布式领域,这一问题的一种可行解决方案是采用自组织云(Ad Hoc Cloud),即由多个机器人以自组织和对等的
针对大规模、高维度数据的无监督特征选择,一直是机器学习领域的研究热点,其中,面向动态、高速数据流的在线无监督特征选择算法的研究,更是在诸如在线异常诊断、媒体数据分析和智能视频监测等应用方面具有迫切需求。真实的应用数据普遍存在维度高、流速快、类型复杂等特点,这给面向数据流的在线无监督特征选择提出了新的挑战:第一,高维数据往往分布为不规则的非线性流形结构,存在潜在结构挖掘困难的问题;第二,新样例实时到
随机微分方程是学界研究的一大热点,能够更准确地描述随机复杂系统的演化规律,而在针对随机微分方程的研究中,为随机微分方程构造和分析数值算法占据了核心地位.分数阶微分方程理论也在近期引起学界的大量关注,克服了整数阶微分方程在描述在物理、生物、控制等多个领域产生了广泛应用.非线性Schr(?)dinger方程是量子力学领域最经典的一类方程,在流体力学、种群动力学中也经常应用于构建模型,而随机分数阶非线性