基于Multi-agent的分布式数据挖掘系统研究

来源 :河北师范大学 | 被引量 : 0次 | 上传用户:tanmite123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的日益发展,分布式系统的应用越来越多,应用者关注的是如何从这些分布式系统的海量数据中挖掘出有效的信息。面对分布式系统中的种种困难,如数据源的分布存储、数据源异构、数据量大、网络带宽小等,现有的集中式数据挖掘方案很难有效地解决分布式数据挖掘中遇到的问题。分布式数据挖掘要求系统具有如下特点:1)分布式处理,避免将逻辑上或物理上分布存储的数据集中于同一数据仓库,减少对网络带宽的占用;2)并行处理,系统应能够对不同分布的数据进行并行挖掘,尽量避免频繁访问异地存储的数据;3)兼容性强,系统能够兼容分布式系统中不同类型的数据源类型。针对这些特点,多Agent系统以其灵活的管理方式、高效的并行处理能力,成为了解决分布式数据挖掘的一个有效的方案。使用多Agent系统进行分布式数据挖掘受到越来越多研究者的关注。本文在介绍Agent技术和数据挖掘相关理论的基础上,经过研究近年有关多Agent系统和分布式数据挖掘的成果,提出了一种新型基于多Agent技术的分布式数据挖掘系统模型(A New Multi-Agent System for Distributed Data Mining简称NMAS-DDM)。该模型系统用Agent建立了一个分层管理的结构,以满足分布式数据挖掘对分布处理和兼容性的要求,同时,系统又采用基于知识的消息传递方式,以避免对网络带宽的过多占用。对系统中任务的分派和调度做了进一步的研究,提出了基于任务量和维度的任务分派方式,以及相应的任务调度方式。在此基础上,为NMAS-DDM制定了消息传递方式和报文格式,以求在最小程度下占用网络带宽,而又能满足系统的需要。最后,针对系统的结构特点,给出了用于NMAS-DDM的分布式挖掘蚁群算法,进一步体现使用多Agent系统进行分布式数据挖掘时灵活、高效的特点。
其他文献
当前Web 2.0应用日趋成熟,许多在线社交网站,例如网络论坛、个人博客、问答社区等流行起来,并受大众的热捧。其中,网络论坛作为社交网络中的一种开放互动式平台,成为新闻信息
学位
数据挖掘分类技术中的统计模型被分为产生式和判别式两大类,这两类模型是近几年数据挖掘和机器学习的研究热点之一。产生式模型学习的是联合概率,主要侧重各类数据的分布情况
随着计算机网络的结构日趋复杂、规模快速增长,非法入侵不断增多。传统的被动安全防御技术已明显不能满足需要。入侵检测技术作为新一代的安全防御措施,构建了主动的信息安全
为了推动中国高清媒体播放机产业良好发展,拥有一种具有自主知识产权的高清节目容器格式是非常必要的。另外,出于更好地满足人们生活的需要以及更合理的版权保护考虑,NVD高清
野外障碍物识别问题一直以来都是智能车载系统研究的热点之一,由于野外环境的特殊性,车载系统对野外障碍物识别的性能受到光照、景物以及周围环境等因素的影响,难以取得较好
在无线传感器网络中,网络层的路由协议主要包括两方面功能:一方面必须在源节点与汇聚节点之间建立优化的消息包传递路径,另一方面又要保证消息包在中间节点处的高效转发。无线
在信息技术日新月异的时代背景下,基于IP网络的VOIP在满足语音质量、语音同步等方面与传统的电路交换的差距在缩小。由于其低廉的成本和良好的技术发展前景,很快在全球赢得了
P2P系统的“非中心化”结构给系统带来了C/S系统无法比拟的优势,同时也带来了一些问题,即它没有一个确定的拓扑结构,它该采用哪一种拓扑结构、采取怎样的数据组织形式和怎样
目前PWE3的组网技术单一、缺乏灵活性,难以满足特定网络组网的安全及计费要求,其适用性在现实复杂的网络环境中不高。针对上述问题,探讨了MPLS PWE3的相关概念及研究现状,并