论文部分内容阅读
知识爆炸和数据泛滥使人们需要从数据中挖掘出有用的信息、获取所需的知识、并对知识进行推理。随机和不确定是现实世界本身固有的特征。因此,我们需要一种表示定量的不确定断言,以及将这些定量断言结合起来并支持不确定性推理和决策分析自动化的方法。概率网,即贝叶斯网和影响图,逐渐成为不确定诊断、预测、决策支持、分类、数据挖掘的主流范式,并为它们提供了直观、有效、可靠的计算方法。概率网是目前应用人工智能中最有前途的技术之一。概率网的知识表示与推理也是智能数据分析、知识发现以及不确定人工智能的重要研究方向。实际应用问题往往导致复杂的概率网,而概率网的推理与学习都随着变量数目指数增长,且用户的需求并不是一成不变的。因此,总是要求一个模型可以有效地求解并满足不断变化的需求是比较困难、甚至不可能的。为了提高模型的适用性和推理效率,本文着重讨论了在没有可用数据的条件下贝叶斯网和影响图的结构优化和模型重构问题。本文的主要工作与创新包括以下三个方面。第一,研究了概率网的约简方法。对于贝叶斯网,本文给出两个充分必要条件确定局部模型的图形特征,并在此基础上给出一个局部模型的学习方法。其次,本文定义了结点之间的一个等价关系,并通过逐层聚集等价节点学习层次模型。对于影响图,本文定义了一个决策节点之间的决策协作和依赖的相关关系,并证明它是一个等价关系。其次,给出影响相关决策期望效用的变量集合,即相关变量。此外,基于相关决策和相关变量给出确定影响图局部模型的方法。在本研究中,局部模型可以获得用户关心的子模型,并保证局部推理等价于全局推理。层次模型通过封装细节与局部,为复杂问题提供了一个层次抽象。概率网的约简优化模型、扩展模型可用性,避免从海量数据学习模型,还可以将推理限制在一个较小的模型上,为提高推理效率奠定基础。第二,研究了概率网的可分解性。对于贝叶斯网,本文在以往工作的基础上给出一个简单的扩展算法,该方法可以无损地将贝叶斯网分解成一组模型。对于影响图,本文将求解序从单个决策结点扩展到决策结点的集合,定义了决策结点集合的极值概念。其次,本文证明了影响图的全局最优解可以通过极值上的局部最优解确定。基于极值概念,本文对影响图进行相关分析并给出影响图的分解方法。极值集合使得不存在标准求解序的影响图的分解成为可能,并有效地扩展了相关分析的局限。概率网的分解将复杂模型转换为一组等价的子模型,为降低概率网的推理复杂度提供了基础。第三,研究了局部模型的融合方法。本文给出两个充分必要条件确定全局概率网的图形特征。在此基础上,本文给出一个不依赖于数据的无损融合方法。其次,当局部模型之间的冲突和不一致不可避免的情况下,本文给出一个学习最小I图的方法,它能尽量保留个体信息。此外,本文证明所给融合方法比直接从数据中学习模型的方法有效。本文的融合方法可以在没有数据的条件下学习到全局模型,避免通过专家构造的主观性,使得推理更准确,补充了概率网学习方法,