论文部分内容阅读
针对大数据的处理效率问题,论文主要应用娃adoop技术,探讨了分布式技术应用于大数据挖掘的编程模式。论文以k_means算法作为研究对象;采用Hadoop的一个数据仓库工具--HIVE来实现该算法的并行化,并在结构化的CUI数据集上进行了实验,实验结果表明该方法具有优良的加速比和运行效率,适用于结构化海量数据的分析。