论文部分内容阅读
大型开放式网络课程MOOC(Massive open online courses)中预测学习者的学习结果会遇到数据分布不平衡问题,为了克服这个问题提出一种结合降采样的堆模型的机器学习算法。该模型弥补了降采样算法的不足,使用堆模型作为框架避免了采样时重要训练样本的丢失。在特征提取时,因为混合多门课程建模,为了防止不同数据分布之间的干扰,借鉴推荐系统的物品相似度引入课程相似度特征有效地传递了数据之间的信息。通过筛选基础模型建立了堆模型(融合模型),在一个大样本的MOOC数据集上进行实验对比,研究表明该