论文部分内容阅读
针对传统分类算法及技术在处理海量异构数据存在的系统性能拓展性低、计算量大、耗时长、分类效果不佳等问题,采用Map-Reduce与邻近分类算法融合设计适合大数据处理的并行分类混合算法,利用加权欧氏距离并行计算,达到提高海量数据分类效率、提高分类识别率和减小资源开销的目的,搭建Hadoop集群研究并在多个数据集上测试算法的可行性.实验结果表明,并行分类混合算法在海量数据分类中显现出较好的分类效果,是可行的海量数据分类模型.