基于MapReduce编程模型的改进KNN分类算法研究

来源 :长春理工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:yangsongzhao99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用一种属性约简算法,将待分类的数据样本进行两次约简处理--初次决策表属性约简和基于核属性值的二次约简。通过属性约简方法来删除数据集中的冗余数据,进而提高KNN算法的分类精度。在此基础上应用MapReduce并行编程模型,在Hadoop集群环境上实现并行化分类计算实验。实验结果表明,改进后的算法在集群环境下执行的效率得到很大提升,能够高效处理实验数据。实验执行的加速比也有明显提高。
其他文献
分析探讨了碳钢、低合金钢在全浸区、潮差区和飞溅区的点蚀行为及规律。结果表明,点蚀速度在腐蚀初期发展较快,以后趋于稳定。低合金钢在不同海水腐蚀区带的耐点蚀性并不总优
为提高红外图像清晰度,提出一种基于高斯多峰拟合和直方图规定化的红外图像增强算法。首先对图像直方图进行平滑处理,通过求导获得直方图波峰数目,对直方图进行高斯多峰拟合,并通过BML映射规则获得规定化图像。为补偿丢失的弱边缘信息,采用四方向Sobel算子获得原图的梯度,利用梯度对规定化图像进行锐化以增强图像轮廓细节。实验表明,经过该算法处理的红外图像,可识别度和层次感都明显优于传统算法,使红外图像视觉效
某电厂4#海水泵断续工作33个月后,泵轴产生局部腐蚀。本文根据材质、浸泡和腐蚀疲劳等试验结果,预测了泵轴的腐蚀和可能发生失效的过程是:泵轴局部表面镀铬层脱落,镀层下的3Cr
在役运行管道的原始阴极保护系统失效。对该工程阴极保护系统进行改造时,需要根据现场具体情况,制定正确的设计方案,通过合理的的施工工艺,以达到最终的阴极保护效果。本文同时对
对实验室设备计量管理进行了探讨,并结合笔者自身在实验室计量管理方面的体会提出了一些看法与观点。
薄膜材料库中的光学常数与实际制备的相比有很大差别,精确求解在特定工艺条件下的光学常数对设计和制备多层薄膜具有重要意义。在熔融石英(JGS1)基底上,采用热蒸发沉积方法制备
随着对临床手术、免疫疾病、心血管疾病等科室患者血液凝固情况床旁快速检测(POCT,Point of Care Testing)的需求越来越大,凝血快速检测技术及方法引起学者及商业的广泛关注。本
介绍了全新的多层粉末三层PE涂装技术,采用环氧粉末、中间粘接剂粉末和聚乙烯粉末等多层粉末完成三层PE涂装,对此项技术的成型工艺进行了阐述,对三层PE防腐具有很大的推广价值。
用于检测的偏振光中包含被测样品丰富的微观信息。细胞发生病变时,细胞结构发生变化,正常细胞与病变细胞对相同的偏振光有不同影响,通过偏振成像获取变化了的偏振特性可以进一步区分正常细胞和病变细胞。设计了一套采集前向散射偏振图像的Mueller矩阵显微成像系统,使用该系统采集了人体正常肝细胞和肝癌细胞的偏振图像。对经Matlab处理得到的Mueller矩阵图像数据进行Mueller矩阵变换,可以得到具有一
针对传统的电磁超声换能器导线与铝板间由于集肤效应导致加载效率较低这种情况,设计了一种改造电磁超声加载线圈和整体结构的新型电磁超声加载装置。基于有限元仿真软件,分别