数据挖掘功能组件的设计与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zero_ak47
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是信息科学及其应用中一个非常有前景的发展方向。数据挖掘,也叫做知识发现,用于提取蕴涵于大型数据库、数据仓库、互联网、其它数据源、以及数据流中的代表有用知识的模式。如今,以爆炸性速度增长的数据使得人们迫切需要一种自动化的数据挖掘工具用于将大量数据转变为有价值的信息和知识。DM2是一款由我们自行设计并开发的数据挖掘平台,该平台的设计目标是为了服务于中小型的数据挖掘项目。DM2平台不仅支持当今主流的数据库产品,如Oracle、MySQL、SQLServer等,而且还与著名的数据挖掘实验平台Weka相兼容。目前,我们已经完成了平台核心结构的设计和开发,并在其基础上实现了ID3、Naive Bayes、FP-Growth、Closet等数据挖掘算法。这篇文章主要介绍了DM2平台的详细设计思想,包括数据类型的设计,与数据库交互的方法,以及一些挖掘算法的基本原理等,同时本文还介绍了我们利用DM2平台在铁路货票数据上所进行的数据挖掘实验。
其他文献
随着计算机技术的飞速发展,图像处理和计算能力得到了极大提高,计算机视觉也取得了较快的发展。视觉目标跟踪技术是计算机视觉领域的重点问题。目前,虽然专家学者已经研究了
云计算是目前研究热点之一。随着云计算技术的发展应用,给人们生活带来了极大的便利与快捷。但云计算发展也受到安全性制约,如数据的存储、传输的安全性以及用户的隐私。同态加
随着信息化技术的发展,计算环境围绕着人们生活的方方面面,智能手机作为人与周围环境沟通媒介的作用也越来越重要。为了适应这个身份,对于智能手机软件架构的要求也越来越高
近年来,以互联网、无线通信为传播载体,以数字化多媒体内容为核心的数字媒体产业在全球范围内快速崛起。本文以数字音像内容集成分发平台课题为依托,其目标是构建一个全网络
在未来作战中,无人机(Unmanned aircraft vehicle,UAV)的作用与地位是举足轻重的。如果无人机的作战活动只能依靠地基网络,那它的活动范围就大受限制;而如果无人机的作战活动完全
随着信息化步伐的加快,软件危机呈现出愈演愈烈的趋势,如何有效维护和利用现存软件资源去缓解危机的研究也变得更加紧迫。软件逆向工程的主要任务是分析系统、抽象系统和展现
机会传感网络中,由于感知区域地形的限制和网络通信质量的不断变化,整个网络可能被分割为多个互不相连的子区域,各区域间通过Ferry节点进行间歇性连通。网络拓扑频繁改变,导
21世纪是计算机软件发展的春天,软件系统朝着网络化、服务化和全球化的方向不断发展。然而发展的同时也暴露出软件行业的一些弊端,在很多软件开发过程中,面对不断变化的性能
如今,人们对便捷化和智能化生活的需求越来越多,基于视觉的人体行为识别分析被广泛的应用在人机交互,安全防护,教育教学等领域。因此,高准确率的实现行为的识别和分析具有极
海洋Argo浮标监测数据具有不确定、轨迹分布、大批量以及由于Argo浮标“随波逐流”等特点,导致浮标观测剖面在时间和位置上的不确定性,Argo浮标受海水漂流和恶劣气象的影响,会造