并行数据挖掘方法在水利普查成果分析中的应用

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:yliudl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着第一次全国水利普查的结束,海量的水利普查数据随之产生。将云计算技术应用在水利普查数据挖掘领域,可以更加快速、高效和低成本地为水利决策提供科学、合理的支持。本文提出基于Map/Reduce的水利普查数据决策树分类挖掘方法 MRC4.5算法,并将该算法应用于全国水利普查地下水取水井数据挖掘中。实验结果表明,与传统的C4.5算法相比,MRC4.5算法在处理大规模数据集时具有更高的执行效率和良好的加速比。
其他文献
以微分几何曲率计算公式为理论基础,对常用的Mark Meyer离散点云曲率估算方法进行改进,提出基于Voronoi区域面积的改进Mark Meyer算法。针对Mark Meyer算法中Voronoi区域面积的
针对中国运载火箭技术研究院箭体结构设计的现状,研究并开发箭体结构设计知识管理平台。介绍平台实施的3个关键技术:显性知识挖掘技术、隐性知识挖掘技术和设计知识检索技术。
介绍基于键值存储的优点以及发展趋势,提出键值存储模型中支持事务的方法。新型的键值存储数据库应该具备传统数据库的事务能力,新型数据库实现事务控制,需要与传统关系型数据库