LiNGAM模型的剪枝算法研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:wangyiecuifeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何有效挖掘数据中蕴含的因果关系是自然科学研究的基础问题。统计学中变量之间的相关性不等于因果关系。变量之间的因果关系应当具有可预测性,可解释性,以及可干预性等特征。Pearl等人在贝叶斯网的理论基础上,通过附加因果马尔科夫等假设提出了因果模型的基础理论。该因果模型采用有向无环图来直观地描述,并采用贝叶斯网络作为基本的推理工具。在贝叶斯网络结构学习之后,因果结构学习与推断成为近年来新的研究热点。因果结构学习与贝叶斯网络结构学习均是从观察数据中去寻找一组变量的结构,但是因果结构学习得到的是变量之间的因果关系,而不仅是相关性。因果结构学习中一个基本的问题是因果关系的可识别性。近年来,Shimizu等人提出的LiNGAM模型与Hoyer等人提出的加噪因果模型表明,噪音的分布与变量关系的非线性等特征为因果关系方向的识别提供了重要依据。基于此,因果结构学习可分为判断是否存在因果关系与识别因果关系的方向两个基本问题。LiNGAM算法是Shimizu等人提出的线性非高斯因果模型LiNGAM模型经典的结构学习算法,适用于变量数目不多且样本数目充足的因果结构学习。然而本文发现LiNGAM算法所采取的剪枝策略仅依据假设检验等统计学理论,并未考虑到马尔科夫条件这个因果模型的基本假设,并且存在时间复杂度高,在稀疏图上剪枝准确率相对较低的问题。剪枝目的是判断因果关系是否存在,这是识别因果关系的基本问题之一。本文根据贝叶斯网的条件独立性测试的方法,提出了新的剪枝策略。该策略依据因果顺序,将变量的马尔科夫毯作为条件集判断变量之间的条件独立性进行剪枝。由于偏相关系数较为准确的反应判断线性因果模型中变量之间的条件独立性,该策略采用偏相关系数检验作为条件独立性测试的方法。该策略仅需两次条件独立性测试来判断因果关系是否存在,所需的条件独立性测试的次数远小于Spirtes等提出的PC等经典的贝叶斯网络结构学习算法。本文在模拟数据上与LiNGAM算法采用的剪枝算法进行了充分的对比实验。实验表明本文算法准确率高,误剪枝率低。
其他文献
构造了高阶loop代数A2的一个特殊子代数,由此建立了一个3×3等谱问题,利用屠格式得到了一族Liouville意义下的可积Hamilton方程.通过建立双对称约束,得到了该方程族的两组约
统计分析软件用于对已有业务数据的分析,可以发现数据中隐藏的内在联系和潜在规律,可以有效支持各个行业的业务分析,给予决策者以有效的帮助。一般的统计软件把数据存储、数
目的 研究老年心肌梗死患者通过人性化护理的应用效果观察.方法 将我院收治的140例老年心肌梗死患者作为研究对象,将患者分对照组70例和观察组70例.对照组对患者进行常规护理
数据网格提供了一个高性能、大容量、高速传输的并行分布式广域计算平台,解决了分布异构的广域网环境下大规模海量数据的一体化存储和管理问题。为了有效降低数据访问延迟、
图像匹配算法的目标是寻找图像之间的同质区域,进而根据同质区域的映射,建立图像之间的空间对应关系。图像匹配是计算机视觉领域中的一个关键问题,也是三维重建、目标跟踪、目标
网络业务的快速增长对互联网服务质量提出更高的要求,而作为业务交换节点成为制约网络性能的“瓶颈”。由于互联网络复杂的动态特性可以通过网络所承载的流量来反映,同时网络
彩铃业务是一项由被叫(或主叫)用户定制,为主叫用户提供一段悦耳的音乐或一句问候语来替代普通回铃音的业务。用户申请开通彩铃业务之后,可以自行设定个性化回铃音,在其做被
随着数字化技术和网络技术的飞速发展,数字化信息可以以不同的形式在网络上方便、快捷地传输。由于图像、视频、音频等多媒体信息都能以数字形式获得,制作其拷贝非常容易。从
随着存储体系规模的增大以及数据访问密集度的增加,集中式元数据管理已经渐渐不能胜任。现今的高性能计算不仅对存储系统的I/O带宽和元数据处理性能提出了很高的需求,而且对
本论文研究了图论领域的两个问题及其应用:小树宽图和对集可扩图。 近二十五年来,树宽这一概念在图论算法研究的许多方面起到了重要的作用。小树宽图在众多领域都有应用。许