基于Hadoop的Canopy-K-means并行算法的学生成绩与毕业流向关系分析

来源 :西安工程大学学报 | 被引量 : 0次 | 上传用户:woaijiekexun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了探究学生成绩与其毕业去向之间存在的内在关系,提出基于Hadoop的Canopy-K-means并行算法并进行分析.首先基于“最小最大原则”确定Canopy的初始中心点并快速粗糙聚类,将其作为K-means算法的初始聚类中心,并基于MapReduce计算框架实现其并行化.然后以西安工程大学2017届毕业生的教务数据为基础,进行海量教务数据的挖掘分析实验,完成相同毕业流向类型学生的聚类,同时分析各毕业流向与课程之间的内在联系.实验结果证明,改进后的Canopy-K-means算法在处理海量数据时,相比传统
其他文献
标准GB/T4272-2008《设备及管道绝热技术通则》、GB/T8175-2008《设备及管道绝热设计导则》、SH/T3010-2013《石油化工设备和管道绝热工程设计规范》、GB50264-2013《工业设
目的 观察金克槐耳颗粒对Ⅲ期非小细胞肺癌患者免疫细胞活性的影响。方法 74例Ⅲ期非小细胞肺癌患者随机分为二组,治疗组38例采用金克槐耳联合化疗,对照组单用化疗。结果 治疗
随着智慧城市的发展,智慧社区的建设已经成为智慧城市建设的重点。传统的信息化社区已经在物业管理、电子政务方面形成多个应用系统。但是这些系统之间相互独立,形成了多个数
宽带无线信道的多径时变特性会使信号经过信道后发生畸变,出现幅度偏差与相位偏移。为准确恢复信号,接收机需要对接收信号进行检测。正交频分复用(Orthogonal Frequency Divi
重叠复用原理是通信系统最本质的现象。利用重叠复用原理,不仅可以实现高频谱效率传输,还能够获得远优于奈奎斯特系统的性能。重叠时分复用(OvTDM)系统是对重叠复用原理最直
随着能源问题的日益突出,储量丰富的风能作为一种清洁、可再生能源已受到世界的关注。风力发电是风能的主要手段并且已经具有一定的发展规模,中国的风电总装机容量已跃居世界第
随着计算机技术和网络技术的不断发展,在应用领域计算规模和复杂度都大幅提高。传统的利用对称多处理器实现的超级计算机不仅扩展性差,而且造价相当昂贵,很难被广泛使用。但
Li2O-ZnO-SiO2系微晶玻璃不仅熔点低、热膨胀系数高且大范围可调,而且具有良好的机械性能、化学稳定性和电绝缘性,因此被广泛应用于金属和合金的封接。微晶玻璃这些特性取决
随着信息技术的发展,企业数据不断增长,业务逻辑的日趋复杂,传统的BI系统难以满足企业的性能需求。需求决定市场,BI系统只有不断贴近市场需求才可以得到快速发展。基于此,结
随着经济全球化、知识经济时代的到来,现代企业所面临的内外部环境正发生巨大的变化。市场竞争加剧、信息技术广泛应用以及个性化消费,对企业传统的科层制为主的企业组织模式