基于K2评分的贝叶斯网结构学习算法的研究

来源 :北京工业大学 | 被引量 : 28次 | 上传用户:aifuweimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网(Bayesian Network, BN)是联合概率分布的一种图形化表示,由于具有结构清晰,语义明确等特点,因此成为处理不确定性知识表示和推理的一种重要理论模型。贝叶斯网在机器学习、医疗诊断、金融分析等领域有着广泛的应用,并已经取得了较大的成功。但仅由专家构建贝叶斯网通常十分困难,有时甚至是不可能的。因此,从数据中快速、准确地学习贝叶斯网络结构具有重要的理论意义和应用价值。本文在研究国内外现有算法的基础上,针对其中的一些贝叶斯网结构学习算法的不足,以K2网络结构评分为测度,提出了几种改进方法。主要工作包括三个部分:首先,针对目前学习算法参数较多,结构复杂的不足,将禁忌搜索(Tabu Search)应用到贝叶斯网结构学习当中,提出了一种基于禁忌搜索的贝叶斯网结构学习算法。新算法首先利用加边、减边、逆向边三个算子产生当前解的邻域,然后将禁忌表和蔑视准则结合使用来引导和限制搜索过程,两步骤迭代进行,最后达到全局最优解或近似最优解。与其他算法相比,新算法结构简单、参数少,易于实现和应用,同时求解质量也有一定的提高。其次,针对蚁群优化学习贝叶斯网结构算法ACO-B的不足,提出了基于独立性测试和蚁群优化的结构学习的改进算法I-ACO-B。新算法首先利用0阶独立性测试来限制侯选结构的搜索空间,避免了蚁群的一些不必要的搜索,然后融合解的全局评分增益和节点间局部的互信息,给出了启发能力更强的启发函数来引导随机搜索,实验结果表明,新算法能更有效地处理大规模数据,且大幅度提升了学习速度。最后,针对数据不完备情况下贝叶斯网算法学习精度不高的问题,将EM(Expectation Maximization)算法与I-ACO-B算法相结合,提出了能够直接从不完备数据中学习贝叶斯网结构的新算法EACO-B。首先随机初始化未观察到的数据,得到完整的数据集,并利用蚁群算法学习得到初始网络结构;然后进行迭代学习,在每次迭代中根据当前最好的贝叶斯网结构,利用EM估计和随机的采样插入对数据进行完备化,在完备数据下,利用改进的蚁群优化过程使结构不断进化,直到获得全局最优的解。实验结果表明,新方法能够有效地从不完备数据中学习贝叶斯网结构,且与新近的一些方法相比,具有更高的学习精度。
其他文献
目前,互联网规模不断扩大,成为人们最重要的信息来源之一,但同时也出现了“信息过载”的问题,网络上的信息增长速度过快,用户获取所需信息难度越来越大。因此,搜索引擎应运而
高中物理3-2中变压器一节是交变电流的延续,是电磁感应的应用,也是电磁学的综合.其构造自然是闭合的铁芯连接不相连的的闭合线圈而成,原理是线圈间的互感作用,核心关系式遵守
20世纪60年代软件危机的出现导致了软件工程的诞生,近年来,软件工程发展迅速。但是目前,软件工程还没有完全达到人们所寄予的期望值,当软件项目较大的时候,软件危机依然存在,
随着全球信息技术的发展,信息在企业的决策与发展中起着越来越重要的作用,因此企业的信息化建设变得迫在眉睫。不间断的信息化投入使得企业拥有众多不同类型的信息系统,但由于企
随着互联网的迅猛发展,面对着爆炸式增长的Web信息,人们要搜索出自己所需要的信息变得越来越困难。推荐系统作为一种信息过滤的重要手段,是解决信息超载问题的有效方法。协同过
碑刻数字拓片在不接触碑刻的条件下获得碑刻拓片,不仅避免对碑刻本体造成损害,而且能够有效地保证拓片的质量。传统的碑刻数字拓片是基于碑刻图像的处理来获得的,图像处理不
为减弱背光噪音和大气变化对光通信造成的影响,设计基于虚拟仪器技术的光通信跟踪检测系统,使用虚拟仪器技术开发系统微型组件、软件功能,并对基于中值滤波和重心算法的跟踪
无线传感器网络是以数据为中心的自组织网络,用户感兴趣的是无线传感器网络感知的数据信息,而很少关心单个传感器或者传感器网络本身,因此,对无线传感器网络数据库的研究具有
随着计算机支持协同工作(CSCW)的发展,各种分布式系统开始与CSCW技术相结合,如协同编辑、协同软件开发和协同决策等。分布式协同系统越来越趋于开放性和动态性,其中的节点也
随着图像处理和计算机视觉等领域研究的不断发展,基于内容的图像检索技术逐渐成为当前研究中的一个热点。基于内容的图像检索作为一门交叉学科,结合了图像理解、模式识别、人工