基于降采样的堆模型预测大型规模网络课程的学习结果

来源 :计算机应用与软件 | 被引量 : 3次 | 上传用户:new_java
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大型开放式网络课程MOOC(Massive open online courses)中预测学习者的学习结果会遇到数据分布不平衡问题,为了克服这个问题提出一种结合降采样的堆模型的机器学习算法。该模型弥补了降采样算法的不足,使用堆模型作为框架避免了采样时重要训练样本的丢失。在特征提取时,因为混合多门课程建模,为了防止不同数据分布之间的干扰,借鉴推荐系统的物品相似度引入课程相似度特征有效地传递了数据之间的信息。通过筛选基础模型建立了堆模型(融合模型),在一个大样本的MOOC数据集上进行实验对比,研究表明该
其他文献
彼得·伊利奇·柴科夫斯基Piotr·Ilyich·Trchaikovsky(1840-1893),伟大的俄罗斯作曲家。他创作的作品题材广泛,音乐特征鲜明。其在各个创作领域都留下了堪称典
天然气压缩机组作为天然气输送过程中的关键设备,其运行效率和功耗直接关系到增压站的运维成本,而天然气压缩机组节能优化运行中的难点在于如何准确地预测进气压力和轴功率。针对上述问题,采用C语言编译软件,提出基于BP神经网络的进气压力与轴功率预测方法,在Lab Windows/CVI中实现天然气压缩机组节能优化软件开发。该方法通过测试进气温度、输出流量、输出压力来预测压缩机的进气压力与轴功率,依据进气压力
云计算、大数据等传统应用系统中的存储系统往往以虚拟化的形式运行在开源的Linux平台上,随着存储虚拟化技术不断成熟并向多元化发展,用户同样需要基于Windows平台的存储虚拟化服务。针对这些需求,提出一种基于Windows操作系统平台提供存储虚拟化服务的软件,可实现在Windows操作系统中创建虚拟的本地磁盘供用户使用,磁盘中的数据以条带化的形式平均分布在底层各个物理磁盘上。该软件基于海量存储网络
【正】 2003年4月末的一个周日,阿尔卡特在庄胜广场的办公区内显得空荡荡的,空气里还残留着消毒水的味道。似乎是巧合,在法国总理不顾非典的侵袭访华之计,阿尔卡特中国公司董
改革开放三十年,中国经济GDP一直保持在9%以上的增长率。持续迅速的增长背后以牺牲环境、高耗资源等为代价。这次党的十七大中明确提出了加速转变经济增长方式,从单纯的经济增长
随着智能化的发展,单片机技术在众多领域得到广泛应用。如:工业自动化控制,智能仪表,汽车家电,航空航天,计算机网络和通信,温室环境控制等。现代温室及配套设施已采用集约化、专业花
对话信息反映对话者的兴趣,为快速了解对话主题或内容,抽取对话中关键词非常有意义。传统的对话语料关键词抽取方法多基于词频或者共现关系,却忽略语义和主题,因此提出一种基于语义和主题自动关键词抽取方法。结合中文语料训练得到词向量和主题模型;计算词的语义权重,包括词与全文语义相似度权重,词语义聚类权重,词性权重。根据词的语义权重得到Top-N词作为关键词;将TFIDF方法和语义权重方法抽取的关键词作为节点
<正>~~
<正> 中国保险市场的大门在WTO的推动下终于大大方方地敞开了。在中国签定入世议定书后不久,保监会就同时发给6家外资保险公司营业执照,即将在中国落户的外资保险公司谋划着
类比分析是根据已有的开发建设活动对环境产生的影响来分析或预测将要建设项目可能产生的环境影响.该方法需要被选中的类比项目,在工程特性、社会环境、地理自然环境、气候因素