分布式数据挖掘计算框架DDCA及其算法研究

来源 :西安交通大学 | 被引量 : 0次 | 上传用户:snoopyfeile123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先提出了一种应用于分布和并行环境的数据挖掘的计算框架DDCA,详细描述了该框架的思想.之后在此计算框架的基础上提出了一种数据挖掘实现算法DDCP,该算法以大规模事务数据库为基础,将数据有效地分片后作分布或者并行处理,通过节点之间的高效简洁的通信最大程度上降低了节点间传输的数据量,利用随机分配解决数据偏度问题,利用有骗子集合枚举树的动态生成明显降低了磁盘操作,同时提高了查找效率.该计算框架具有很强的灵活万籁 和可扩展性.最后给出了自满的实现数据结构及分析,证明了该算法的正确性和可行性,因此该算法可以在分布式或者并行环境里实现高铲的数据挖掘.
其他文献
该文以神经网络理论为基础,以油藏系统为应用背景,围绕油田复杂非线性系统的辨识、建模、预测等生产和科研问题,对神经网络及其学习算法进行了深入的研究和探索.该文重点做了
在大数据时代,数据的安全性变得越来越重要。为了满足当今用户对数据保护的更高需求,连续数据保护(Continuous DataProtection,CDP)技术应运而生。CDP针对每次操作,先计算差量,然
该文的研究将为中国企业展开新的技术研究及建立高性能的决策支持系统提供新的思路与支持工具.该文将对象关系技术与数据仓库技术有机的结合起来,使多维数据的表示与操作更加
TCP/IP网络技术在网络系统的广泛应用促使了网络管理的产生和发展.ISO定义网络管理的方法和管理框架作为OSI(Open System Interconnect)的一部分.对于基于ICP/IP的网络,简单
传统的联机事务处理大多是基于主机/终端的客户/服务器模型的。在这种模型中,用户在终端主要以Telnet远程登录的方式向服务器提交事务请求,服务器接收用户请求并调用相应的服务
该文在深放分析研究数字化家庭网络的特点和需求的基础上,提出了一个数字化家庭网络管理模型HNMP,用于对家庭网络内的设备进行管理和控制.该模型具有简单、扩展性强和易于实
当今Internet上企业级应用迅速发展,许多商业服务由传统媒体向Internet上转移,许多大的商业公司都看好这个巨大的网上市场,希望快速开发出高质量的网上商业应用系统,同时用户的系
该文首先分析了传统检索系统的局限性和目前构件检索系统面临的问题,然后介绍了该课题实现的基于分布式资料环境的支持多种检索方法自动转换的可重用构件库检索系统ATSS的设
该论文在对USB协议研究和分析的基础 ,采用V-model的软件工程方法,设计和实现了嵌入式平台(VxWorks)的USB协议,包括:USB设备端驱动程序、USB的host端协议栈、和基于协议栈的
随着信息化在人类社会的迅速发展,大量的信息在网络中进行传输的同时,各种各样窃取信息的手段、工具也越来越多,信息泄露事件层出不穷。政府、金融、银行以及企业的信息化步