基于大数据框架的学生行为研究与应用

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:chinaprogram
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅速发展,各大高校的业务也逐渐智能化,多样化,信息化.高校的食堂饭卡、图书馆卡、热水卡合为一体,出现了校园一卡通。校园一卡通的出现,无疑给高校的信息化建设与管理做出了巨大贡献,但随之而来的问题是,高校作为一个人群密集的地方,每天都会不断涌现出与学生密切相关的各式各样的数据,如何合理的将这些随着时间增长的海量数据进行有效的存储及其分析利用是需要研究的一个问题。据了解,现在大多数高校的信息门户都是独立的,没能将各大职能部门数据链路打通,而基于Hadoop的大数据生态圈无疑是帮助我们解决这一难题的有力技术。数据平台的建设不仅能帮我们整合各式各样的数据,方便日后进行数据分析与挖掘,在新冠肺炎威胁着箐箐学子的今天,一个完善的大数据平台更是能为校园安全保驾护航,帮助我们实时、快速、准确采集整理师生在校轨迹。本文的主要工作主要有:(1)基于Hadoop大数据框架提出了校园数据仓库的建设的必要性和优势,并在本地搭建大数据环境,模拟校园数据仓库的建设。(2)利用聚类算法对消费行为数据做聚类分析,并对传统的聚类算法进行了改进,提出了Semi-WDR-Kmeans聚类算法,该算法在高校消费行为数据上的聚类效果表现更为出色,更适用于现实业务场景,并进一步提出了一种结合数据的方法来辅助高校进行贫困学生认定及其国家助学金评定。(3)利用学生在校期间产生的行为面板数据来构造特征,用构造的特征使用多种机器学习算法来预测学生下一学期的期末成绩,分析比对多种算法模型,利用准确率等评价标准选取最优模型来对预测出容易挂科的同学进行学业预警。
其他文献
股票市场是促进资本、科技、实体经济高水平流通的重要枢纽,股票市场中的价格通常被视为经济活动中最有信息效率的,公司管理层会利用股价中的信息进行决策进而提高生产效率。在国家强调高质量发展、重视全要素生产率的背景下,探究股价信息含量对企业全要素生产率的影响具有重要意义。本文利用股价非同步性衡量股价信息含量,运用OP法和LP法构建上市公司全要素生产率,以2004-2019年沪深A股上市公司的相关数据为样本
学位
人工鱼群算法以水中鱼及鱼群的行为为研究对象,通过总结和分析它们的生物习性并通过数学模型描述起来的一种智能仿生优化算法,该算法有诸多优点,如对初始解不敏感,鲁棒性较好,容易逃离局部最优等,受到广泛的关注,并被应用到各个领域中,为解决当前高维,复杂,非线性的工程问题,提供了解决方案和思路。对人工鱼群的深入研究和进一步完善是当前优化领域的一项非常热门的课题。鱼群的觅食,群体聚集,跟随可以帮助鱼群快速定位
学位
张量是高维数据的自然存储形式,它能够有效的保留原始的数据结构,使用张量进行数据挖掘工作,结果具有更高的准确度。张量是深度学习领域的基本数据结构,同时也是构建关系数据模型的主要工具。关系模型是目前比较热门的研究领域,亦是知识图谱、推荐算法等应用方向的基础。本文将张量分解应用到关系模型领域。在关系模型中,Rescal分解是一种插补准确度高,且比CP分解更具解释性的分解算法。过去研究的关系通常是0-1的
学位
<正>策划人语:2月21日,习近平总书记在主持中共中央政治局就加强基础研究进行的第三次集体学习时指出,要在教育“双减”中做好科学教育加法,激发青少年好奇心、想象力、探求欲,培育具备科学家潜质、愿意献身科学研究事业的青少年群体。当前,在加快建设科技强国的新征程中,提升青少年科学素养迫在眉睫。
期刊
收入是民生之源,立身之本。收入差距是普遍的,但是过大的收入差距会引发公众不满心理,阻碍经济健康发展。从十六届三中全会后,我国开始重视收入差距扩大的问题,直到现在缩减居民收入差距依然是社会面临的重要问题之一。改善居民收入差距通常有三种途径,分别为初次分配、再分配和三次分配,其中初次分配完全依托于市场,三次分配取决于个人意愿,所以政府部门只能通过再分配解决收入不均问题。税收是再分配过程的一个重要环节,
学位
协调好地方政府债务与区域经济增长之间的平衡关系对实现高质量转型发展意义重大。本文基于2010-2018年地方政府债务省级面板数据,通过构建修正引力模型,运用社会网络分析方法生成空间关联矩阵,得出地方政府债务网络强度及网络地位集聚状况。从经济空间和地理空间的角度进行模型识别与择优,采用空间杜宾模型拟合地方政府债务集聚与经济增长之间的异质性作用机制,并进行直接效应、间接效应及总效应分解。基于此,得出如
学位
随着互联网技术与物流的发展,网上购物以及搜索产品相关信息变得越来越方便,因此催生出了“在线下实体店评估产品-在线上低价购买产品”以及“在线上搜索产品相关信息-在线下购买产品”这两种零售现象,即展厅现象与反展厅现象。这两种现象的出现改变了线下传统零售商与线上电商之间的竞争情况,引起了大量企业与研究者的关注。线下传统零售商是否为展厅现象的受害者、反展厅现象的受益者?线上电商是否为展厅现象的受益者、反展
学位
受新冠疫情的持续影响,企业的生产经营遭遇到了前所未有的挑战。在当前的特殊时期,缓解企业的债务融资成本,推动中国经济复苏,具有现实意义。媒体在新时代焕发出新活力,随着网络的快速发展,媒体的传播成本急速下降,传播效率直线上升,对社会经济生活的影响也越来越大。企业作为市场经济中的不可忽视的一份子,媒体情绪对企业的债务融资成本会产生何种影响,是否是企业降低自身融资成本的一种新途径?不同的媒体情绪对企业债务
学位
在互联网技术不断发展的时代中,面对庞杂丰富的网络信息,信息的自动准确获取十分重要。信息抽取技术能够对非结构化文本进行自动分类、提取和重构,主要包括命名实体识别、实体关系抽取和事件抽取等任务。在各个垂直领域中,金融行业的信息需求尤为明显,快捷准确地从海量金融文本中获取结构化信息有助于监管者和投资者科学决策,并且实际工作中,金融信息往往以公告、财经新闻和研究报告为内容载体,文本篇幅长又包含动态事件描述
学位
对从酿造白酒的大曲和麸曲中筛选出的细菌进行了酸性蛋白酶酶活性的测定,并对方法进行了验证与优化,结果表明当发酵时间为168 h时,固体培养基A产生的酸性蛋白酶的酶活性达到最高值。并用该方法对不同来源细菌的酸性蛋白酶酶活力进行了测定,在实验室筛选了一株蛋白酶活性较高的细菌,其活力最高能达到249.3 u/g。
期刊