论文部分内容阅读
贝叶斯网络作为处理变量间因果关系表达和推理的有效工具,在人工智能与数据挖掘领域受到广泛的应用。但传统的贝叶斯网络也存在以下三个问题,制约进一步的发展。首先是传统贝叶斯网络只能处理离散变量,处理其它类型变量时需要先进行离散化,这样容易产生―边缘锐化‖问题。特别是面对模糊变量时,会造成大量的信息丢失,影响推理精度。然后是贝叶斯网络的结构学习是NP-HARD问题,在高维数据下,其网络结构的搜索空间会呈指数增长,常用结构学习算法的效率都会变得低下。最后是传统的结构学习算法无法识别马尔科夫等价类,当搜索空间存在大量的马尔科夫等价类,搜索效率就会很低,且很难收敛到最优解中。针对问题一,本文根据模糊理论对传统贝叶斯网络进行扩展,给出了能兼容模糊变量的混合贝叶斯网络的完整方案。对于问题二,则提出了一种新型的约简组合方案通过把建网问题分割为多子网的构建,降低高维数据的影响。同时该方法在聚类的过程同时确定子网间的连接点,避免了二次搜索,与同类算法相比降低了计算复杂度。聚类的过程使用了基于因果的相似度,降低分网建立对结构质量的负面影响。最后针对问题3,则把基于信息几何的因果推断与爬山法结合,提出了改进的爬山算法IGCI-HC,解决传统结构学习算法无法识别马尔可夫等价类的不足。高校资产管理直接影响高校的建设与发展。影响高校资产管理的因素有多个,具有高维且涉及因素类型多的特点,如何挖掘分析因素间以及资产管理效率间的因果关系并给予知识推理决策辅助,是本文的应用要点。本文根据72所高校的资产管理相关数据,建立了结合约简组合算法的混合因果网,对该问题进行了知识推理分析。实验结果表明,混合贝叶斯网络虽然因模糊变量的处理增加了一些计算复杂度,但是通过结合约简算法与IGCI—HC算法,降低了计算复杂度。另外,由于其采用了模糊概率表示变量的不确定性,解决了边缘锐化的问题。与传统的贝叶斯网络相比,混合贝叶斯网络在网络质量与推理精度上都要更为出色。