论文部分内容阅读
贝叶斯网(又称信度网或因果网)是一种基于概率推理的数学模型,它起源于人工智能领域的研究,是一种将概率统计应用于复杂领域、进行不确定性推理和数据分析的工具。随着对其研究的不断深入,贝叶斯网已经成为不确定性知识表达和推理领域最有效的模型之一,并因此在很多领域有着广泛的应用。尽管有着坚实的理论基础,关于贝叶斯网在给定不确定信息下的知识合成及推理机制的研究仍然存在很多有待进一步探讨的问题。本文针对这些问题,主要从事了以下几个方面的研究:知识合成算法及其性质的探讨。基于IPFP及其扩展C-IPFP的知识合成算法的研究已经比较深入,然而该方法只在约束集一致时收敛。而现实应用中,由于海量数据的来源及获取手段的不同,作为概率知识的约束集相互之间往往存在相互矛盾之处。为此,Vomlel提出了约束集不一致时的知识合成算法CC-IPFP、GEMA算法。而实验结果表明,CC-IPFP和GEMA算法计算复杂度高,且收敛速度受初始值的影响很大,使得其在应用中的性能不可预测。针对该种情况,本文在研究上述各算法的基础上,提出了一种新的基于IPFP的合成算法SMOOTH,并在理论和实验上讨论了新算法的收敛性能。数值实验结果表明,SMOOTH算法在约束集一致时,退化为标准IPFP算法;在约束集不一致时,SMOOTH算法与GEMA算法具有相同的收敛结果;且算法不受初始值的影响,收敛速度稳定,与GEMA相比收敛速度快;同时可以调整平滑因子实现算法的加速收敛。对于贝叶斯网知识合成问题,本文在Peng和Ding工作的基础上,介绍了E-IPFP算法,并首次详细给出了算法在概率约束集一致时的收敛性证明。由于E-IPFP是基于IPFP算法的,在约束条件相互不一致或约束条件与网络结构不一致时,算法并不收敛。为此,本文将E-IPFP算法与SMOOTH算法相结合,对E-IPFP进行了改进。数值实验结果表明,改进后的算法在概率约束集不一致时同样能够达到收敛,并能够处理约束条件与网络结构不一致的情况。文中详细介绍了不确定性证据下的贝叶斯网信度更新。首先系统阐述了不确定性证据的分类及各自的特点,探讨了在单一证据下不同信度更新算法(Jeffrey’s rule, virtual evidence method和IPFP)之间的关系。在Pan和Peng工作的基础上介绍了多重证据下贝叶斯网的信度更新算法,BN-IPFP。同时对其进行了改进,使得算法不仅能够处理多重证据下的信度更新,而且能够解决证据不一致的问题,并在理论和实验上验证了改进后算法的收敛性。最后,论文讨论了贝叶斯网在语义网本体不确定性推理中的应用。通过扩展BayesOWL理论框架,使得其能够将更为一般的本体(如OWL DL)转化为贝叶斯网。同时通过对OWL本体语言的扩展,使其能够描述任意以概率形式给出的关于本体的不确定性知识,并根据贝叶斯网知识合成算法将其合成到转换后的贝叶斯网中,从而建立起关于本体的概率知识库;通过贝叶斯网信度更新算法,实现在给定不确定性证据下的后验概率查询,完成了本体不确定性推理问题与贝叶斯网推理问题的转化。最后实现了该理论框架的原型系统,提供了相应的应用程序接口,为从事该领域研究工作的人提供了一个实用的工具。