论文部分内容阅读
随着人工智能技术的迅猛发展,人们越来越趋向于研究能推理和解决问题的人工智能关键技术。因果关系推断研究主要是通过分析纯观测数据来揭示事物间的因果信息,它在解释、预测、决策、控制等方面起到很好的推理作用,是近年来人工智能领域的热点研究方向之一。同时,随着大数据的发展,在电信、金融、互联网、生命科学等行业出现了高维数据的研究需求,因此高维因果网络结构学习是目前急需解决的重点和难点。本文应用了条件独立性测试、独立性测试、智能优化算法等工具,理论和实验结合对高维因果网络发现存在的两个急需解决的挑战性问题:1)基于约束方法的独立性假设检验可靠性低;2)基于评分搜索的方法总体效果不佳,进行了深入地研究。本文的主要研究内容如下:1、研究基于独立残差测试的高维因果网络结构学习算法。在因果网络发现问题里,基于约束的方法常用条件独立性测试来检验变量之间的因果关系,随着网络变量的增加,条件集组成的集合越多。针对这种“维度灾难”导致因果网络结构学习的时效性和准确率下降的情况,本文提出了一种基于独立性测试的新方法,避免了条件独立性测试所需条件集的组合数量多的问题。首先将运用传统的条件独立性测试方法简化为两个非条件独立性测试的方法,保证了在条件集下对任意两个变量集的关系进行可靠地检验;从理论证明了所提出的两个非条件独立可推导出相应的条件独立。在传统的基于约束方法的基础上利用非条件独立性测试替换条件独立性测试,对高维数据进行独立残差测试得到变量之间的关系,逐步推断出完整的因果网络图。从理论推导和实验表明,该方法提高了高维因果网络结构学习的可靠性。2、研究了基于条件集维度约简的高维因果骨架学习算法。在高维数据中,传统的因果网络学习方法存在着速度慢、准确率低等特点,根源在于条件独立性测试的条件集合复杂。针对以上问题,首先采用基于最大依赖度和最小冗余度的互信息方法寻找待测试两个节点的各自因果节点集,同时对两个因果节点集进行并集优化得到候选条件集;利用传统的基于约束方法结合优化后条件集进行因果关系推断,最终推断出完整的因果网络图。从实验数据表明,本文提出的方法准确率优于传统的PC算法。3、研究了基于低阶条件独立性测试的高维因果骨架学习算法。传统的PC算法,特别在对高维数据进行网络学习阶段,条件独立性测试一直困扰着该算法的进展。针对以上问题,本文首先采用了低阶条件集进行快速的PC算法运算得出了粗糙的因果骨架图;接下来利用分裂-合并方法将粗糙因果骨架图分裂成若干个小网络,分别对小网络逐个进行因果关系推断得出因果骨架结构;最后把所有小网络合并形成完整的因果骨架。本文提出的方法在实验结果表明,该方法运行的结果比现有的方法的可靠性和效率都有所提高。4、研究结合K2(一种通过评分搜索方法找最优结构的因果骨架学习方法)和BSO(头脑风暴优化算法)的高维数据因果网络结构学习算法。评分搜索方法在因果网络结构学习上也得到较好的运用,同样也面临着高维数据条件下搜索评分方法不可靠的问题。本文提出的K2-BSO方法,首先利用K2算法对因果节点次序进行评分,改进距离评价函数并完善算法的聚类过程;接下通过BSO的四种个体更新方式进行种群优化,直至因果网络评分值收敛。该方法解决了传统K2算法容易陷入局部最优的缺点,在有限的时间内提高算法的可靠性,实验结果表明本文提出的方法比K2算法、和K2-GA算法在可靠性方面更优。基于约束的方法和基于评分搜索的方法是传统因果网络学习的两个基本方法,在低维网络的情况下,算法的表现较好;但是在高维网络的情况下,两种算法效果不佳。本文针对高维因果网络的特点以及网络学习方法的特点,提出了四种适应于高维因果网络结构学习算法,并从理论和实验证明了算法的有效性。