贝叶斯网络结构学习及其应用研究

被引量 : 94次 | 上传用户:pomerku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中存在着大量的不确定性现象,建立有效的模型是对不确定性问题正确决策的关键。针对问题领域中变量之间的不确定性关系,贝叶斯网络提供了一种紧凑、直观且有效的图形表达方式。建立高效稳定的贝叶斯网络学习算法是贝叶斯网络走向应用的关键所在,多年来,贝叶斯网络学习及其应用一直是国内外研究的热门课题。本文在对贝叶斯网络的国内外研究现状进行全面分析的基础上,针对结构学习目前所面临的收敛速度慢和可能收敛于局部最优两大主要问题,对数据完备和数据缺失两种情况下的贝叶斯网络结构学习进行了研究,并进一步地对贝叶斯网络在灵敏度分析和频繁模式挖掘中的应用进行了研究。全文主要内容如下:1.贝叶斯网络的结构学习研究①数据完备情况下贝叶斯网络的结构学习:研究发现MCMC方法抽样过程产生的马尔可夫链具有各态遍历性,并能保证最终收敛于平稳分布,因而具有良好的精度。 MHS是最常用的MCMC方法之一,但MHS算法抽样过程的融合性差,收敛速度较慢。本文从初始值、建议分布和对网络子结构的抽样三个方面对MHS抽样算法进行改进,提出了一种贝叶斯网络结构学习算法PCMHS,该算法同时进行多个MHS抽样,构建多条并行的收敛于Boltzmann分布的马尔可夫链。算法PCMHS首先基于节点之间的互信息,进行所有马尔可夫链的初始化,在其迭代过程中,算法PCMHS基于并行的上一代抽样的样本总体得到产生下一代个体的建议分布,并通过同时对网络中弧和子结构的抽样产生下一代个体。算法PCMHS能收敛于网络结构的平稳分布,因而具有良好的学习精度,而该算法又通过使其初始分布和建议分布近似于其平稳分布,有效地提高了抽样过程的收敛速度。在标准数据集上的实验结果也验证了算法PCMHS的学习效率和学习精度明显优于经典算法MHS和PopMCMC。②数据缺失情况下贝叶斯网络的结构学习:针对数据缺失严重情况下,具有缺失数据的贝叶斯网络结构学习方法存在的学习效率偏低和易于陷入局部最优等问题,本文建立了一种具有缺失数据的贝叶斯网络结构学习算法BC-ISOR,该算法基于界定折叠方法从缺失数据集学习不同变量子集的概率分布,然后基于依赖分析方法进行网络结构的学习。针对属性个数不超过30的数据集,算法BC-ISOR可以通过一遍扫描数据集得到所有已经发生的实例数和可能的实例数,其对缺失数据的处理效率与数据的缺失率无关,并通过在结构学习的过程中采用启发式切割集搜索算法和在冗余边检验之前识别出所有的边的方向来降低条件独立性检验的次数和阶数,因而具有良好的学习性能。在标准数据集上的实验结果表明该算法具有良好的学习效率和学习精度。2.贝叶斯网络的应用研究学习贝叶斯网络的目的是基于贝叶斯网络的推理开展贝叶斯网络的应用研究。①贝叶斯网络的灵敏度分析:贝叶斯网络的灵敏度分析基于连接树推理算法,主要包括证据重要性分析和参数灵敏度分析。Shafer-Shenoy和Hugin算法设计了两种不同的基于连接树的推理分析算法的消息传播方式,相比于Shafer-Shenoy算法,Hugin算法具有较高的推理分析效率,但在邻接树中存在零因子的情况下不能保证能够通过局部计算进行灵敏度分析,针对这一问题,本文通过在Hugin算法的消息传播过程中引入零因子标志位和零因子处理机制,提出了一种用于进行灵敏度分析的Hugin算法的改进算法R-Hugin,并从理论和实验两个方面证明了R-Hugin算法的正确性和有效性。②基于贝叶斯网络的频繁模式发现:本文采用贝叶斯网络表示领域知识,提出一种基于领域知识的频繁项集和频繁属性集的兴趣度计算和剪枝方法BN-EJTR,其目的在于发现当前领域知识不一致的知识,以解决频繁模式挖掘所面临的有趣性和冗余问题。针对兴趣度计算过程中批量推理的需求,BN-EJTR提供了一种基于扩展邻接树消元的贝叶斯网络推理算法,用于计算大量项集在贝叶斯网络中的支持度,同时BN-EJTR提供了一种基于兴趣度阈值和拓扑有趣性的剪枝算法,实验结果表明:与同类方法相比方法BN-EJTR具有良好的时间性能,而且剪枝效果明显,分析发现经过剪枝后的频繁属性集和频繁项集相对于领域知识符合有趣性要求。
其他文献
<正> 过去,国内许多中国现代史专著、教科书,在论述全面抗战爆发后德国对华政策时,几乎都这样写道:德国一贯支持日本帝国主义侵华。史实恰恰相反,全面抗战爆发初期,德国出于
我国正处于经济体制改革和产业升级的新时期,科技型中小企业作为我国经济增长的重要支柱力量,融资难一直制约着其发展。商业银行作为支持科技型中小企业的重要融资渠道,近年
本文以莫扎特的歌剧创作中启蒙主义思想为研究对象,通过莫扎特的歌剧《费加罗的婚礼》展开论述。采用文献资料法、个案分析法、逻辑分析法等研究方法,深入挖掘莫扎特歌剧中的启
文章以中国31个省、自治区、直辖市为研究单元,从6大方面建立了中国土地利用综合效益评价指标体系,借助Matlab6.5,运用对应分析方法对中国土地利用数据进行分析,得到了更多的
语言测试是语言教学中一个重要的组成部分,它在对外汉语教学过程中有着举足轻重的作用,它不仅是教育评估的主要手段,而且能够有效地辅助教学。本文首先简单地介绍了语言测试
目的:探讨自发性蛛网膜下腔出血(SAH)并发癫痫发作的危险因素及其护理措施。方法:采用回顾性病例对照法,依据是否发生癫痫发作将225例SAH患者分为病例组(36例)和对照组(189例
独立董事制度的是公司治理发展过程中的一大成果,我国在20世纪末正式引进了独立董事制度,对弥补我国监事会制度的不足、改善公司治理结构等方面都发挥了积极作用。近年来,随
第一部分大鼠局灶性脑缺血后处理动物模型的建立目的:建立大鼠局灶性脑缺血后处理(ischemic postconditioning, IP)模型,并确定IP对局灶性脑缺血再灌注(ischemic reperfusion,
《巴黎圣母院》中的副主教克洛德·孚罗洛具有多重性格,从其诞生之日起,人们就对他评价不一。有人说他是教会势力的化身,也有人认为他是淫邪、虚伪、凶残的化身,还有人指责他
本文取材于司法实践中一个真实的毒品犯罪案例,公诉人参与了本案的审查、审理过程,在起诉和审判过程中,发现了一些值得探求的问题,如通过诱惑侦查手段取得的证据对案件定性影