面向MOOC的用户学习行为数据分析技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:wangzhao0922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着计算机行业的飞速发展,大型开放式网络课程即MOOC,逐渐在国内外兴起,名校在在线教育平台上提供大量免费精品课程,为更多学生的自主学习高校课程以及其它相关专业课程提供了可能。目前MOOC的主流包括Coursera、Udacity、edX三大平台。MOOC已经成为在校学生等在课外的主要学习方式。MOOC的快速发展,以及其中产生的海量数据,也使得数据分析面临越来越大的挑战。数据分析技术日新月异,在不同的平台上有着不同的应用,然而看似优秀的数据分析技术,却在不同的平台有着截然不同效果,而比较通用的一个缺点表现在用户的冷启动问题上,即当一个新用户进入到平台中,因为数据的缺乏,往往很难对这类用户作出正确合理的分析。在线教育平台近些年产生的数据量以及种类愈发庞大,而用户的行为数据,相比之前相关领域通过静态数据分析,有更好的效果。因此,如何高效的利用这些数据帮助用户获得更好的学习体验面临着巨大挑战。学术界关于数据分析的研究大多关注数据分析的相关算法,工业界现有的数据分析技术通用性较高,但大多是多数据进行简单的分类聚类,单一的分类或聚类算法的效果并不不理想,达不到对用户提供指导性的建议,如何快速地,易于操作地利用现有的分类聚类等算法来进行数据分析,是大数据商业化发展的主流。针对非同一分布的实验数据和训练数据,本文对基于实例的迁移学习算法TrAdaboost提出了一种改进方法,以适应不同分布的数据集。数据集经过预处理之后,运用该算法能够在一定程度上,很好的缓解在线教育平台中新开或冷门课程的冷启动问题。对于整合分类聚类等算法上,Boosting算法的思路为本文分类器的集成优化,提供了一个很好的解决方案。本文针对多标签的AdaBoost系列算法,提出了一种改进思路,能够很好地降低算法的学习错误率。主要思路为修改算法的样本分布调整策略,将现有AdaBoost算法中样本分布的均匀性打破,使得在每添加一个弱分类器的过程中,能有效地降低学习错误的上界估计,藉此实现对多标签AdaBoost算法的性能提升。
其他文献
分析经济评价方法与参数第三版与第二版的区别,旨在深入理解经济评价方法与参数第三版的内容,更好的将第三版应用于项目设计中。
短期负荷预测是能量管理系统(EMS)的重要组成部分。本文对人工智能在电力系统短期负荷预测中的应用,包括专家系统、模糊预测、神经网络、支持向量机,进行系统地综述和分析,指出现
依据1991~1993的十个村庄的研究,我们区分出来三种制度类型,每一种在界定作为地方的村庄上都大有不同。每一种又造就了不同的领导类型,尽管它们相互可能都是一致的。这些村庄
<正>研究表明,近年来用行政内部委托的方式改组的评估院、评估中心等组织并没有独立法人的地位,而评估对象也没有区别于以往被动接受行政检查的
《永乐大典》与《马可波罗游记》杨志玖作者简介:杨志玖,山东淄博市人。回族。1915年生。南开大学历史系教授。中国元史研究会名誉会长,蒙古史学会理事,隋唐史学会顾问,中国海外交通史
城市空间扩展一直以来都受到多重因素的影响。文章以昆明市主城区为例,利用CA模型分别从单一坡度因子以及经济、人口、坡向、坡度等多因子两个方面分析昆明市主城区历年的土
电子商务和资讯网络化彻底改变了传统商务赖以生存的基础,形成了对传统营销策略和市场理念的冲击和挑战.然而交易的最终实现还有赖于后台的物流管理产业,传统的运输仓储方式
标准化管理是现代管理的一种重要手段,电力企业实行标准化管理,是提高电力企业管理质量的有效途径。电力企业要实现标准化管理,就要建立高效、科学以及规范化的标准化管理体系,为
小型水库的调洪计算,一般用分时段调洪法计算,但很繁琐和费时,用Д、И高切林公式的为数也不少,对于小集雨面积的水库误差一般为大40%以上,大的可达69%,尤其是小二型水库,一般