论文部分内容阅读
大数据时代的到来在一定程度上加剧了数据量的赋存,为此提出一种基于分布式KNN分类器的大数据分类处理方法。引进分布式KNN分类器,对大数据回归任务进行聚类处理,使用KNN算法对未知项进行检索,以欧几里德距离作为度量的标准,导出欧几里德距离计算结果,完成对任务的聚类。同时,整合MR框架,定义一个value处理键,将待分类的样本数据进行Map映射处理,规范大数据分类处理流程,当样本数据集合与中间key具备直接关联时,执行分类处理行为,完成对大数据分类处理方法的设计。在此基础上,设计对比实验证明设计的基于分布式K