基于Hadoop的成绩管理系统研究与建设

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wushiguo208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考试成绩作为检验学生对所学知识的掌握程度与评估教学质量的重要依据,它背后蕴藏着大量的待挖掘的信息。所以对于成绩数据的管理与分析一直都是是考试过程的一个重要环节。传统的成绩管理方式是每个学校独立保管各自的学生成绩记录,采取这样方式的缺点就是只能了解各自学校的情况,且只能进行简单的分析和查询操作,并不能从记录中挖掘出数据之间的相互关系,从而无法探究出数字背后隐藏的信息。如果能将所有学校的成绩集中起来管理,建立一个基于全国学生的学习成绩管理系统,那将是有极大好处的。基于Hadoop的成绩管理系统即是这样一个平台。它主要面向有升学压力的初高中学校学生,提供两方面的查询功能:一方面,可以通过传统的成绩排名和平均成绩查询认识到本人在全国同龄学生中的水平和位置,从而选择填报适合自己的升学志愿。另一方面,通过考试成绩的聚类分析结果,可以发现各科成绩之间的关联并清楚认识自身的强项弱项,从而有针对性的提高自己。学校通过使用此系统,还可以由聚类分析发现课程之间的关联,从而合理的安排选课。另外,为保护个人隐私,该系统只显示成绩数据而隐去相关学生信息。本文首先对Hadoop平台和HBase数据库的特性进行深入学习,详细分析了HDFS、MapReduce的底层原理和运行机制,对比HBase分布式数据库和传统数据库的区别与优势。然后结合成绩管理平台的需求,围绕该成绩管理系统进行了详细的设计并实现。接着描述了设计的系统框架,纵向来看,此系统系统架构由上到下可以分为用户层、分析层、运算层和存储层四层。横向来看,此系统功能模块可分为用户注册与登录模块、成绩排名查询模块、平均成绩查询模块和聚类分析模块。详细介绍了每层实现的功能,并对每个功能模块进行数据表的设计和编码实现。在对聚类算法的研究中,本文首先对聚类算法整体进行学习,重点研究K-Means算法和改进的PSO-K-Means算法,并在Hadoop上实现这两种算法。通过这两种算法对数据的聚类分析结果比较两者的聚类效果。选用K-Means聚类算法进行深层次的成绩数据分析,结合成绩数据的特点,对K-Means算法初始点的选取进行改进,然后再用此算法对成绩数据进行分析,得出相应结论。最后详细介绍了Hadoop实验环境构建,然后实现各模块功能得到最终的运算结果,并对Hadoop处理大规模数据进行了分析。
其他文献
本研究是为了检验关于东西方文化造成的性诉求中美丽和性感建构的两种方式的假设。本实验是对166名在校大学生对分别对两种诉求方式和两种商品的共六种广告进行态度测量,实验
盾构隧道成型后的轴线偏差对整体隧道使用功能影响巨大,如何在盾构掘进过程中控制好轴线偏差对隧道施工至关重要。本文结合实例对泥水盾构在特殊地层中的纠偏技术进行了探讨,
为探索高震区大跨度桥梁的动力特性及抗震性能,本文以刘家峡大桥为例,通过建立空间有限元模型,对其动力特性及抗震性能进行研究,以保证结构的抗震安全和促进设计优化。研究表
悖论的基本含义是超越现存的概念与观点,"表面看来是逻辑矛盾或者荒谬的陈述,结果却能从赋予其积极意义方面来解释"。自从布鲁克斯提出"诗歌语言是悖论语言"的命题后,悖论被
电力系统微机保护装置中,模数转换模块是其重要组成部分.TMS320C28x系列DSP内部集成ADC转换模块,为提高ADC转换精度,提出了一种提高了MS320C28xDSP芯片内置A/D转换器精度的方
统一与对比是歌曲写作始终要遵循的基本原则。它是写作的原则,也是发展创新的原则。分析优秀的歌曲作品,证明它是统一与对比有机结合的完美体现。
以某299.3m超高层框架-核心筒结构为研究对象,针对该工程的自身特点提出了设置屈曲约束支撑、肘节式和人字形连接黏滞阻尼器的3种耗能减震层控制方案。在8度小震作用下,对比
1922年香港海员罢工是中国共产党成立后我国工人运动第一次高潮的起点,被称为“中国第一次罢工高潮的第一怒涛”,在中国职工运动史上具有重大的历史意义。领导这次罢工运动的
<正>引言如今,具有高比强度、高比模量、可设计性强、良好抗疲劳性等性能的先进复合材料得到了广泛运用[1]。复合材料的力学性能参数是开展复合材料相关研究与应用的基础。由
会议
在全球水资源日趋紧张的今天,污水灌溉有着特殊的意义,许多国家把废污水作为重要的灌溉水源;现在,污水也已经成为中国城镇近郊灌溉用水的重要水源。污水灌溉使得大量重金属元