因果网络的分解得分学习与局部结构学习

来源 :北京大学 | 被引量 : 0次 | 上传用户:jieys75001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因果网络模型已被广泛应用于很多领域。利用数据进行因果网络的结构学习是因果推断研究领域中的重要问题之一。当前已有一些算法可以从观测数据学习变量集的全局因果网络或局部因果关系。全局网络结构学习算法的复杂度为NP,随着变量数目的增多,复杂度迅速上升。目前一些局部因果关系学习算法,即使得到大样本数据甚至真分布,也不能保证能够学习得到正确的局部网络。针对现有的全局网络结构学习算法和局部结构学习算法的上述弱点,本文探讨新的结构学习算法,提出全局网络结构学习的得分分解算法和逐步扩展的局部网络学习算法。主要研究内容包括:  ⑴利用条件独立性信息,提出了将全局网络的BIC得分学图问题分解成两个较小网络上BIC得分学图问题的BIC分解学图算法。由于有向无环图(Directed Acyclic Graph,DAG)的数目随着变量数目的增多以超指数的速度增长,所以将一个大网络的BIC得分学习问题分解成两个或更多小网络的得分学习问题,可大大降低算法的复杂度。  ⑵在条件独立性检验的框架下,提出了局部扩张学习算法:PCD-by-PCD算法和MB-by-MB算法。两个算法从学习目标节点开始,每步学习一个节点的父子后代(parents-children-or some descendants,PCD)集合或Markov边界(Markov Boundary,MB)上的局部图,并根据条件独立性检验更新学习的局部网络,当可判断当前学出的局部网络与真图的Markov等价类一致时算法停止。PCD-by-PCD算法和MB-by-MB算法可得到与全局网络算法相同的局部网络结构,同时有更高的时间效率。相比于PCD-by-PCD算法,MB-by-MB算法对样本量的要求较大,但在大的稀疏网络上有较快的速度。  ⑶在一些实际研究中,我们只关注某个响应变量附近的局部网络,但是不能同时观测所有变量,而是每次只能观测到某个变量和与它相关的一些变量。现有的算法都是基于整个变量集的完全观测数据进行学习。本文基于独立性检验和BIC得分搜索,提出了在这种不完全观测情况下逐步观测和逐步学习相结合的全局网络结构和局部网络结构的学习算法。  ⑷对所提出的全局结构学习的分解得分算法、逐步扩展的局部结构学习算法和不完全数据的结构学习算法从理论上论证了它们的正确性,并利用模拟方法对这些算法进行了评价和与其他算法进行了比较,模拟结果体现了所提出算法的有效性和正确性。
其他文献
1994年,Kitayama基于光纤通信技术在医学图像、数字视频广播以及超计算机可视化图像传输方面的应用,提出了一种新型的、采用空间扩频技术实现的光码分多址并行图像传输系统.与
本文所讨论的图G都是简单图,对于边集M(∈)E(G),如果G的任意顶点至多与M中的一条边关联,则称M是G的匹配.称覆盖所有顶点的匹配为完美匹配.M是G的匹配,如果对于匹配M,满足E(V(M))=M
随着我国高等教育的不断发展和改革,高职院校的体育教学情况逐渐引起了国家教育部门的重视.高等教育的定义也在发生着改变,不仅仅重视对学生文化素养的培养,而将体育素养及职
毛萼田菁(Sesbania rostrata Bren&Oberm)原产热带非洲,喜高温、高湿生态环境,植株含氮量高,是高产优质绿肥,并有一定耐盐性。对毛萼用菁的生长发育及其共生固氮的生态生理
如何在篮球教学中使教学内容不枯燥,让学生全身心的融入课堂之中.首先身为教师要结合篮球运动的特点精选教材其次运用适合的教学方法,合理安排强度,循序渐进,不断提高自身专
基于我国社会经济的迅猛发展,高职学生的体育素养问题已经引起人们的重视.为了有效保证高职学生的体育素养得到更好的提升,采用合理的教学模式具有非常重要的作用.在高职体育
该文介绍了当今国内外文献中有关预条件共轭梯度法(PCG法)的新成果,并在此基础上对预条件共轭梯度法、特别是多项式预条件共轭梯度法时行了进一步研究,探讨了预条件共轭梯度
人们研究同宿轨分岔的问题已有很久的历史.前人从几何的观点出发,利用Poincaré映射去构造Melnikov函数,函数的零点就对应着同宿轨的保持.人们也常称该方法为Melnikov方法.后来,人
社会竞争的日趋激烈迫使着人们逐渐意识到了合作学习的重要性.体育课的足球教学也不例外,在足球教学中贯彻合作学习的思想理念不仅能一改传统教学过于机械的现状,同时也较好