基于插件技术的数据挖掘平台的研究与设计

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:zyf008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的来临,人们逐渐进入一个数据量急剧膨胀的时代,面对海量的数据不知道该如何利用,人们普遍面临着“数据丰富而知识贫乏”的问题。数据挖掘技术的产生和发展为人们从海量的数据信息中发现有用的知识提供了一条有效的途径,数据挖掘系统则架起了数据挖掘技术与数据挖掘应用之间的一座桥梁,数据挖掘系统的研究和开发将有利于推动数据挖掘应用的进一步推广,促进数据挖掘技术的发展。设计和开发数据挖掘系统已经成为目前的研究热点。目前,已经有很多数据挖掘系统得到开发和应用,但其集成的算法功能和数目固定。因此,研究具有较强可扩展的数据挖掘系统及其集成技术,对提高挖掘系统的应用价值具有十分重要的理论意义和实用价值。   本文从数据挖掘过程模型入手,确定了数据挖掘系统的设计准则。通过引入插件和软件架构的概念,提出了基于插件架构构建的数据挖掘系统的设计思想。在从框架和层次角度对系统进行详细分析的基础上,对基于插件架构的数据挖掘系统进行了体系结构设计。之后,本文对体系结构中的功能模块的划分和各自的功能进行了详细的定义。描述了平台的工作机制,并对数据挖掘系统实现中的一些关键技术问题进行了分析解决。   在完成系统主要功能组件的分析与设计的基础上,对课题提出的基于插件架构的数据挖掘系统平台进行了原型系统实现。平台采用JAVA编程语言、MVC设计模式,存开源软件Eclipse平台上,开发图形界而化原型系统,实现具体数据挖掘实例的调用和管理。平台提供友好的用户界面,使系统管理、维护和升级简单、方便。通过原型的实现,为进一步实现数据挖掘平台的开发实现提供一定的参考价值。
其他文献
P2P网络是一种分布式网络,它不依赖于某个中心服务器来提供服务,任意两个计算机节点都可以是服务的提供者也可以是服务的请求者。相比C/S模式,P2P网络具有容错性好,鲁棒性强,
当今信息技术不断发展,各种形式的信息大量涌现,其中文本形式的数据量特别庞大。人们希望快速、准确而全面的获取信息的同时,必须面临在巨大的信息资源中找寻有价值信息的难题。
传统的数据挖掘方法假设训练数据和测试数据服从相同的数据分布。然而,在许多情况下,这种同分布假设并不能得到满足。当分布发生变化时,传统的数据挖掘方法必须从头开始,需要
因环境变化导致皮肤病变异,其种类持续增多,发病率以及致死率也在不断升高,已经得到世界卫生组织的关注。目前,皮肤病诊断大都采用传统临床诊断方式,极大依赖于医生的临床经
高校内各职能部门为了提高各自的工作效率,满足各自职能的需求,建立起了基于不同平台、不同开发语言等千奇百态的信息系统,使得高校内信息系统与日俱增,然而各信息系统相互独
数字水印技术是一种有效的数字产品版权保护手段,其通过将有意义的数字信息隐藏在媒体中作为版权证明的依据。在过去几十年里,三维模型已被广泛地应用于虚拟现实、医学图像、
不经意传输协议(OT)是一种可保护隐私的密码协议,它既可以作为基本组件构造其它安全协议又可以单独应用于电子商务、医疗保健、内容保护等系统中以保护参与者的隐私。因此,提
随着互联网技术的迅速发展,各计算机终端都可以轻易拥有海量的信息资源,人们获取信息的渠道增多了,但同时也让很多用户觉得力不从心,当用户在网络上搜索信息时,往往就会因为
随着互联网技术飞速发展和普及以及嵌入式设备的小型化、智能化和网络化的发展,同时人们随时随地对于视频信息获取的迫切需要,将嵌入式智能设备接入互联网,并可以进行流媒体业务
学位
支持向量机是在统计学习理论上发展起来的一种新型机器学习方法,在解决模式识别领域中小样本,非线性,超高维等问题方面表现出明显的优势。为了解决现实中的数据在输入空间中