基于网格的分布式数据挖掘体系结构研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xiang88_77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术在社会生活各个领域的快速应用,人们越来越重视数据收集工作,建立了数量众多的数据库,把它们广泛应用于商业、行政、教育、科研等不同行业。同时,为了从丰富的数据资源中找到自己需要的有益信息,人们又提出了数据挖掘和分布式数据挖掘的方法。前者能在大量数据中自动发现感兴趣的知识。后者则利用了分布式技术来实现数据挖掘。目前,分布式数据挖掘已经成为数据挖掘的主流形式。另一个方面,网格作为一种新型的分布式计算技术,逐渐成熟。网格具有超强的计算处理能力、良好的系统扩展能力和高效的分布式资源管理能力。它突破了计算能力的限制、存储能力的限制、资源分布的限制、资源共享方式的限制,适用于计算密集型、数据密集型应用。利用网格技术进行分布式数据挖掘是一种全新的尝试。为此,本文对基于网格的分布式数据挖掘体系结构进行了研究,提出网格分布式数据挖掘的解决方案,即在网格中间层之上,为网格应用建立分布式数据挖掘中间层,为用户提供了更加通用的分布式数据挖掘平台。论文的前四章是相关技术知识背景。首先介绍了分布式数据挖掘技术,阐述了分布式数据挖掘的概念、模式、研究内容、工作流程,指出了传统分布式数据挖掘系统存在的主要问题。接着对网格技术进行了总体描述,研究了它们的概念、特点,及其应用领域。然后具体地分析了Web服务资源架构的技术规范,研究了globus项目工具包GT4服务组成。论文第五章,进行了网格分布式数据挖掘中间层设计。分析了网格分布式数据挖掘体系结构,提出了网格分布式数据挖掘中间层模型,将分布式数据挖掘中间层划分为四个服务资源:全局WS资源、局部WS资源、算法WS资源、数据分配WS资源,定义了它们的服务接口和资源属性,描述了服务调用的流程。最后,进行了中间层服务资源原型实现。描述了各个WEB服务资源的资源属性文档,实现了操作这些资源属性文档的接口,使用统一建模描述语言描述了各个Web服务资源的静态结构图。并且,通过安装网格中间件,建立了基于局域网的网格试验环境,以一个分布式挖掘实例进行了试验,从而论证了论文提出的网格分布式数据挖掘中间层的可行性。
其他文献
基于闪存芯片的固态盘具有较低的读写延迟,在I/O密集型应用环境中有望代替传统磁盘,但是其单盘容量比磁盘低一个数量级。为了增加固态盘的容量,工业界不断减小闪存芯片的工艺
粒计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究。粒计算的内容包括两个主要的方面,一个是如何构建信息粒,另一个是如何利用粒运
互联网的飞速发展极大地方便了人们从网络上获取多媒体数据,同时也给版权保护这一课题提出了新的挑战。数字水印技术是一种将版权信息嵌入到多媒体数据中的方法,已经应用于版权
在计算机接口技术课程教与学的过程中,实验是必不可少的。随着计算机接口技术的飞速发展,目前市场上供应的实验仪器并不能完全满足教与学的需求。本课题针对现有计算机接口实
近年来,随着各种移动终端拥有量不断提高,在全球的通讯市场中,移动无线互联网接入已经成为最新的移动服务和最快的发展区域。基于IP的移动宽带无线接入技术802.11和802.16发
RMI-IIOP模型的价值在于RMI可以使用CORBA的IIOP作为分布式对象通信中的标准传输协议,使得RMI应用程序与CORBA系统之间的互操作成为可能。RMI最初使用的JRMP是一个非标准的协
随着基于闪存的固态盘技术的不断发展,当前被广泛应用于混合存储系统中。它具有随机读写性能高,能耗低,噪声小的优点,但相对于传统机械磁盘,容量小,价格贵,受擦写次数的限制
基于角色的访问控制模型是近十几年来在自主访问控制和强制访问控制的基础上发展起来的一种重要的访问控制技术。基于角色的访问控制模型的特点是通过分配和取消角色来完成用
政府工作中存在政府管理企业的工作模式。在政府部门实施电子政务,存在政府系统和企业系统并存的现象。政府需要从企业系统中抽取内容和数据来发布信息,而这些企业系统在开发平
电子邮件作为互联网发展的产物,如今已与人们日常的工作生活密不可分。网络安全审计系统通过实时监控上网场所内用户的网络活动,收集了大量的用户邮件,其中垃圾邮件占据了绝