数据挖掘中的贝叶斯网络学习模型优化研究与应用

来源 :长沙交通学院 长沙理工大学 | 被引量 : 0次 | 上传用户:yu830329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识.数据挖掘是信息技术自然演化的结果.目前数据挖掘技术已成为机器学习、数据库系统、人工智能等领域内热门的研究方向.贝叶斯(Bayesian)网络近年成为数据挖掘引人注目的研究方向.与数据挖掘其它方法相比,贝叶斯网络的优点是可以综合先验信息和样本信息,这在样本难得时特别有用;可以发现数据之间的因果关系,适合于处理不完整数据集,这是其它模型难以做到的.贝叶斯网络的学习也就是要找出一个能够最真实反映现有数据集中各数据变量相互之间的依赖关系的贝叶斯网络模型.该文提出了一个贝叶斯网络学习模型的优化策略,即概念层次+(MIAC方法+Jie Cheng&David Bell算法)+BC算法,对在不完整数据集和存在连续属性的情况下贝叶斯网络的学习做了些小小的研究工作(在该文中着重研究了贝叶斯网络结构学习方面).在第三章中,将面向属性归纳中的概念层次方法引入到学习模型中,通过大量文献阅读,将文献中的AGHC算法和AGPC算法引入到本文中,经比较分析,选取了效率更好的AGPC算法作为我们的自动分层算法,为贝叶斯网络学习用于连续属性数据的提供了一点可供借鉴的小经验.基于相关性分析的BN学习算法和基于记分搜索的BN学习算法各有其优缺点,该文将两者结合,即采用Jie Cheng&DavidBell算法学习BN结构和BC算法用于不完整数据下的BN参数学习.该文对JieCheng&David Bell算法进行了局部的小优化,使之效率更高,并借鉴BC算法思想提出了一种互信息近似计算的方法(MIAC,Mutual Information ApproximateComputation),其可用于基于相关性分析的算法,对在不完整数据集下学习贝叶斯网络结构还是有一些实用意义;最后通过基于该文的一个课题,给出了贝叶斯网络学习在一个EPAD系统中的应用.
其他文献
IPSec(IP SECURITY)是近年来发展起来的一种网络安全标准,它在网络层针对IP包进行加密和认证,以保证数据的保密性和完整性。本文从网络安全问题开始,首先简单介绍了IPSec协议体
社交网络的开放性和互联性,造成了社交网络中信息来源广泛,更新速度快。在海量的社交消息中,最终只有一小部分会引起人们的兴趣和关注,最终流行或爆发,造成巨大的社会影响,甚至引导
地球表面积的71%是海洋,我国拥有299.7万平方公里的海洋国土。从安全需求上来看,要监控恐怖袭击、海盗、走私、偷渡等违法活动,发现违法侦测、资源侵占等行为,为国土安全提供屏障
最近几年,神经网络的应用越来越广泛,在图像、语音、机器翻译等领域都取得了卓越的成绩。为了提升神经网络的效果,神经网络的规模逐年递增,结构日益复杂。这导致神经网络的计算量
随着计算机网络技术的高速发展和网络应用的不断普及,人们萌发了随时随地访问因特网并获得满意的多媒体服务的强烈愿望,这已成为通信服务提供者和使用者的理想目标.无线移动
在远程教育大力推广的今天,虚拟实验已被广泛应用于远程教育实验教学系统中.由于计算机程序执行的动态效果和计算机硬件的时序变化关系较难仿真,从而很难反映出硬件实验现象
本论文在介绍了“NTN”校准技术背景的基础上,详细阐述了“NTN”校准技术的原理、实现过程及优势。本文的主要研究内容是用PSPICE软件对“NTN”校准技术的关键理论、方法进行
七号信令网是通信网的神经中枢,在电话网、移动网、智能网等通信网中已成为不可缺少的一部分,其畅通与否直接关系到整个电信网的通信质量,这就需要一套监测系统对七号信令全网进
在高通量众核处理器执行任务过程中,众核处理器共享资源有限而资源消费者众多,这给处理器的调度策略带来挑战。高通量众核处理器属于并行体系结构,其核心部件资源为处理器核、存
家庭多媒体服务器是数字会聚、3C融合的产品.计算机、半导体设计和制造以及网络技术的飞速发展促进了家庭多媒体服务器的出现;信息家电的兴起加速了家庭多媒体服务器平台的研