高维数据下的因果关系发现混合算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:asdhjy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因果关系是自然科学的一个基本问题.尽管很多研究者致力于从观测数据中寻找事物间的因果关系,但是目前依然没有有效的方法来解决高维度下的这一问题.在本文的工作中,我们提出了利用两种因果关系发现方法组合而成的混合发现算法.该方法的整体思路是利用因果关系的骨架,然后利用加噪模型的方法识别因果关系的方向.具体来说,本论文的主要工作及创新点有:  (1)基于因果马尔科夫假设,通过使用结构学习的算法,在高维度下学习出目标变量潜在的因果骨架.为了能在非线性数据下依然能学习出较好的因果骨架,本文选用了Zhang提出的核条件独立测试方法代替传统的独立测试方法.所获得的因果骨架不仅克服了非线性加噪因果模型无法在高维度下识别因果关系的问题,而且也大大降低了识别结果中存在的冗余.  (2)根据数据的非线性属性,使用Hoyer提出的因果模型.该模型打破了变量间的对称关系,能从本质上识别出变量间的因果关系,解决了传统贝叶斯网络方法只能识别出部分变量间的因果关系的不足,从而能在高维数据下更好地识别变量间的因果关系.  为了说明所提出方法的有效性,我们分别在虚拟数据和真实数据下进行了实验,并与Hoyer提出的模型进行比较,实验结果表明了混合发现方法在解决大规模因果关系识别这一问题上的有效性和稳定性.
其他文献
随着中国股票市场的不断完善和发展,越来越多的人开始关注股票价格的高低,目前而言,对中国股市平均价格高低的讨论也一直没有停止过.因此,作为衡量股价高低的指标之一的“平均市
Bent函数在应用密码学,组合数学,编码理论等领域有着广泛的应用.近些年来对Bent函数已经进行了大量的研究工作,取得了一系列重要的研究成果.本文主要研究k≥2时有限域F*22k上的
设A为Artin代数,modA为代数A上的有限生成左A模范畴,indA表示modA中全部不可分解模组成的满子范畴,范畴C表示indA的前继闭满子范畴。  文章首先证明,如果C中存在倾斜模,且在C中E
高温合成导热油对我国导热油市场十分重要,高温合成热导油是一种进行热能量传递的物质,它的使用应该说是大势所趋,在各个行业有着重大的意义。对于高温合成导热油的研究,国内外也是十分重视,对该项研究进行了大力的探讨与投资。  一、高温合成导热油的分类  1.烷基苯型(苯环型)导热油  这一类导热油为苯环附有链烷烃支链类型的化合物,属于短支链烷烃基(包括甲基、乙基、异丙基)与苯环结合的产物。其沸点在170~
本文所考虑的图都是有限简单图.我们用V(G),E(G),F(G),△(G),δ(G)和g分别表示平面图G的顶点集,边集,面集,最大度,最小度及围长.对任何一点v∈V,我们把与v相邻的所有点的集合记作N(v),用d
做好高中学生党员发展工作,就是从政治上关心青年学生的健康成长。调查中很多高中生表示,党校学员、入党积极分子既是一种荣誉,是同学、老师、学校对他们的肯定,更是一种责任
在微分几何、数学物理以及很多其他学科领域中出现很多问题都是与非线性微分方程组的求解有关,对于这些问题的研究显得尤为重要.拓扑度理论的建立,为研究非线性方程多解问题提
本文主要研究了一类带Coulomb位势的半线性椭圆方程-△u-Z/|x|=|u|p-2u-λu,u∈H1(R3),其中2<p<10/3,λ和Z>0为实参数.这类问题有很强的物理背景,由于区域的无界性,导致Sobolev嵌入失
在不同的疾病状态下,基因相关性网络经常发生变化。了解这些网络如何在两种不同疾病状态间的重新布局是基因组研究中的一项重要任务。为了实现这一目标,很多差异网络分析模型被
本文主要研究利用正则化的一般经验贝叶斯(GEB)方法估计正态分布的均值,基于Jiang(2013)中的正则化方法,我们将Brown and Greenshtein(2009)中的正态核密度函数及其导函数单