论文部分内容阅读
因果关系是自然科学的一个基本问题.尽管很多研究者致力于从观测数据中寻找事物间的因果关系,但是目前依然没有有效的方法来解决高维度下的这一问题.在本文的工作中,我们提出了利用两种因果关系发现方法组合而成的混合发现算法.该方法的整体思路是利用因果关系的骨架,然后利用加噪模型的方法识别因果关系的方向.具体来说,本论文的主要工作及创新点有: (1)基于因果马尔科夫假设,通过使用结构学习的算法,在高维度下学习出目标变量潜在的因果骨架.为了能在非线性数据下依然能学习出较好的因果骨架,本文选用了Zhang提出的核条件独立测试方法代替传统的独立测试方法.所获得的因果骨架不仅克服了非线性加噪因果模型无法在高维度下识别因果关系的问题,而且也大大降低了识别结果中存在的冗余. (2)根据数据的非线性属性,使用Hoyer提出的因果模型.该模型打破了变量间的对称关系,能从本质上识别出变量间的因果关系,解决了传统贝叶斯网络方法只能识别出部分变量间的因果关系的不足,从而能在高维数据下更好地识别变量间的因果关系. 为了说明所提出方法的有效性,我们分别在虚拟数据和真实数据下进行了实验,并与Hoyer提出的模型进行比较,实验结果表明了混合发现方法在解决大规模因果关系识别这一问题上的有效性和稳定性.