一种增量Markov网学习方法

来源 :云南大学 | 被引量 : 0次 | 上传用户:jiangyang0266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
马尔可夫网(Markov network)是一种无向图,是对不确定知识学习和推理的重要工具。它以无向边来表示变量间的依赖关系,具有直观、简便的特点。学者提出了很多从数据中学习Markov网的算法。但是随着数据的增长,已有的Markov网经常不能表示出增长后的数据所蕴含的知识。从增长后的整体数据中重新学习Markov网是一种直接的方式,但这意味着要完全抛弃原有网络和已有的信息,并对原有数据重复挖掘。从效率角度看,这种方法是不可行的。我们需要一种增量Markov网学习方法,在原有网络结构和新增数据的基础上得到新的网络结构。在假定相对原始数据,增量数据规模很小的情况下,本文提出一种增量Markov网更新算法(iMU),它充分利用原有网络和已有信息,先把主要工作集中在对增量数据的挖掘上,然后在原有网络结构上进行局部更新得到新的Markov网。这种方法将对原有网络的更新分为两步:结点更新和边更新。在结点更新的过程中,我们利用增量Apriori算法得到新的频繁项集,根据1-频繁项集将原有网络结构中的结点进行相应地删减。在边更新过程中,为了控制测试的边的规模,我们提出最需要更新子结构的概念,对最需要更新子结构内部的结点之间进行条件独立测试,增删相应的边。具体来说,如果有删除的点,我们在结点更新中一并删除与之相关的边。如果有增加的点,我们找出包含增加点的极大频繁集和与之有共同结点的极大频繁集,然后在增加点与这些极大频繁集中的相关结点间进行条件独立测试,添加相应的边。完成结点更新和边更新后,我们得到的Markov网就是能够表示新数据所蕴含知识的Markov网。最后通过对比实验验证,这种算法是正确和可行的。
其他文献
文本分类是指在给定的分类体系下,根据文本的内容自动地确定文本所属的类别.与当前的文本分类技术相比,统计语义方法描述了语义元的相互关系,定义了语义元间的亲和力、语义元
该文在介绍空间数据仓库模型和空间立方体的基础上,结合空间数据立方体的特点,给出了几种空间数据立方体计算的有效方法.首先,由于非空间数据仓库模型的不足,应该扩展现有模
决策支持系统是计算机信息系统技术的热门研究领域之一,基于数据仓库的智能决策支持系统则是近年来这一领域中出现的最新研究成果。数据仓库、OLAP、数据挖掘和AI技术的结合是
该文对生境异质性算法直到有害生物在不同生境中扩散的模型进行了深入研究,主要内容包括如下几个方面:1.在前人研究的基础上,对生境样带边界分析算法进行了改进.在改进算法中
计费管理是网络管理的重要组成部分,它在大型ISP的网络运营中扮演着不可替代的角色.业界对于一套能同时提供高效准确的网络流量采集处理机制和功能强大的WEB计费管理系统具有
论文首先通过数学方法推导出了决定压缩效应的因素,并在此基础上回顾和分析了已有的量化误差统计模型和前后处理技术.针对结合了码率控制机制的率失真最优化迭代前处理方法算
随着云计算技术的广泛应用,人们在享受云计算便捷的同时,其安全性却令人担忧。用户希望云计算平台在带来方便的同时,能够保证数据的机密性与完整性。数据的完整性,可以利用一些校
该文首先分析研究了目前智能规划领域中的典型方法和关键技术,并对通用规划系统的实现机理进行概括描述.通用的规划方法是为了解决一般的规划问题而设计的,在具体应用下效率
图像分割技术是数字图像处理和机器视觉领域内的研究分支,1987年Kass提出Snake模型以来,各种基于Snake活动轮廓模型的改进算法用于图像分割领域,丰富和发展了活动轮廓理论,特
随着计算机技术的不断发展,Internet在日常生活和工作中发挥着越来越重要的作用,网络安全面临更多的挑战。分布式拒绝服务攻击日益猖獗,SYN Flood DDoS攻击是一种容易发动的