基于大数据的高考志愿数据分析关键技术研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:turobc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高考网上志愿填报系统的普及,招生管理单位掌握了大量的考生填报数据。然而由于缺乏高效的分析平台,造成这些数据未能得到有效的利用。而大数据技术的出现,使得这一问题能够得以解决。在此背景下,本文就目前流行的Hadoop分布式处理平台进行深入研究,并围绕高考志愿填报数据分析开展了一系列研究工作,主要研究内容及创新点如下:(1)对分布式处理平台的架构和原理进行了分析和研究,并对Hadoop分布式处理平台的架构进行阐述,分析了Hadoop文件系统,MapReduce计算模型的结构和设计思想。(2)针对大数据处理基本流程,结合高考志愿填报数据的特点并在借鉴了Hadoop设计模式的基础上,设计了一个由核心控制节点、数据预处理节点、计算节点和监控节点组成的分布式数据处理模型,以满足高考志愿数据分析的需求。(3)提出并实现了一种基于遗传算法的任务调度算法,将任务的执行时间和成本纳入到考虑范围,降低任务消耗时间,节约运行成本。对比实验表明,该算法同Hadoop平台采用的FIFO调度算法相比,在任务总响应时间和任务执行成本方面有显著降低。(4)提出了一个改进的协同过滤高考志愿推荐算法,并实现了算法的并行化。实验结果表明,该算法可以为高考考生提供准确的志愿推荐。通过对比串行算法和并行算法的执行效率,验证了算法在不同数量节点下的运行效率。
其他文献
针对祁连县天然草场上有毒有害杂草黄花棘豆、醉马草、狼毒的分布情况以及对家畜所造成的危害性,在深入调查研究的基础上,提出切合实际的防治措施.从根本上清除毒杂草对畜牧
目的了解山东省2014~2017年传染病防治监督卫生行政处罚情况。方法按照类型、对象、依据和违法事实对全省近三年来传染病防治卫生行政处罚案件进行统计分析。结果 2014~2017
在宁波闹市中心的城隍庙美食街区,有一家中华老字号——缸鸭狗甜食店。这家有八十余年历史的专业店,因经营、制作正宗的宁波猪油汤团而闻名遐尔。
期刊
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
冠心病是冠状动脉粥样硬化引起的心脏病,主要是由于脂质沉积于血管壁造成冠状动脉狭窄或阻塞,引起的心肌缺血和供氧不足,近年来逐渐呈现年轻化趋势。冠脉动脉血管支架等介入
近日,有的地方农民朋友反映,从乡村集贸市场买的电池只用两天就没电,衣裤穿三天就开缝,皮鞋一个星期就掉底,"三无"产品更是随处可见,因此呼吁:农民不是消"废"者!
期刊
以蚌埠至五河高速公路项目案例为基础,以PPP模式实施流程为主线,对其主要风险因素进行识别和分析,并对其风险公平分配的关键——项目合同体系的建立进行重点解析,为之后项目
各位党员:大家好,很高兴能通过微型党课这个平台和大家作交流。党的十七大报告中关于党的建设有这样一段表述:
本文结合浙江省首座"全寿命配送式"变电站110千伏杨柳变电站设计实例,介绍钢结构建筑的承重体系、围护墙板、楼屋盖、防火等方面的设计原则。根据目前变电站建筑钢结构的应用现
2008年是学习宣传贯彻党的十七大精神、加快我区“十一五”规划和落实区第七次党代会精神的重要一年。在新的一年里,机遇与挑战并存,困难与希望同在。面对新的历史起点,我们必须