基于用户时序行为的在线教育推荐模型研究与应用

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:wwwunix
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2020年爆发的新型冠状病毒肺炎疫情对我国经济、社会与教育发展都产生了重大影响。疫情初期,国家教育部就提出“停课不停学”的要求,大规模开通“国家网络云课堂”平台和MOOCS平台,并着力开展各类线上教育课程,进一步促进了在线教育获得迅猛发展。在线课程的种类和数目呈现爆发式增长,同时也衍生了各种问题:如何满足用户日益增长的学习需求、如何便利用户准确找到适合的个性化课程、又如何能够挖掘用户学习兴趣所在的领域、让推荐算法赋能在线教育?这些都成为了炙手可热的问题。因此,精确分析把握用户需求,完善开放共享灵活的教育模式,就成为了在线教育的难点堵点问题。其中根据用户需求偏好,精准提供个性化推荐服务就显得尤为迫切[1]。21世纪以来,互联网技术在图片处理、自然语言理解和情感识别等领域取得了重大突破,已然变成人工智能的新潮,为推荐系统的发展作出贡献。近年来随着互联网用户的迅猛增长和在线教育平台数目的激增,对互联网+教育的研究已经成为新的热点,在线教育平台推荐系统的讨论也被推上高潮。推荐算法可以更好地理解用户的偏好,推荐课程的特点以及用户历史交互行为。本文以网易云课堂平台的历史数据为数据源,采用爬虫技术对在线教育的学习资源进行采样和标准化处理。然后选取用户对课程显式及隐式评分信息等,作为训练用户兴趣偏好模型的主要依据。将高维用户-课程矩阵通过分解降维有效解决数据稀疏问题,在冷启动问题中采用top-N推荐规则,并提出通过用户历史行为序列中所隐含的时序信息来识别其喜好或学习习惯的动态演化过程,从而丰富课程内容推荐服务,在供给端提升学习者对课程的满意度,一定程度上能够提高用户的学习效率。本文从传统的(用户,物品)二元交互转移到(用户,物品,时序信息)三方交互上进行研究。研究主要分为四个部分。第一部分是数据的爬取和课程与用户信息分析,在构建冷启动推荐系统时,为评分次数设置一个阈值,解决因数据过于稀疏情况造成的问题。第二部分对用户偏好进行研究,并构造用户-课程矩阵,并在此基础上构造用户行为时间序列,根据用户的学习行为数据来挖掘学习习惯、划分用户群。第三部分对用户时序行为的在线教育学习资源的推荐方法进行设计与研究,通过引入指数衰减函数,将时序信息纳入对学习者偏好的重排序中,并采取矩阵分解构造用户-课程矩阵。第四部分构建预测矩阵,进行相似度计算与推荐排序。预测评分对用户生成推荐列表,推荐得分一定程度上反映了加入时序历史行为的相似程度,结果表明效果较好。本文聚焦用户时序行为的在线教育课程推荐模型,在传统的推荐算法中考虑加入时序性研究,更好地捕捉用户偏好的动态变化,优化互联网+教育发展模式。
其他文献
在“中国制造”向“中国智造”转变的今天,劳资关系在社会经济生活中占据重要地位。随着供给侧改革的深入,劳资关系呈现复杂化、多样化特征,劳资争议频发,“跳楼讨薪”、“黑工厂虐工”事件频繁报道,劳动者权益保障成为应有之义,而工资正是劳资关系中的核心所在,劳动者福利待遇、职业发展等也不可或缺。当前,谈到工资,离不开工资集体协商制度,因为它是劳资双方利益博弈的平台,也是劳资双方平等沟通交流的保障,更是企业民
在目前百花齐放的人工智能领域,计算机视觉技术异军突起,可以完成多种视觉任务,如图像分类、目标检测、图像检索、图像分割等,并在交通、医疗和工业等领域崭露头角。随着科技的进步以及各行业数字化、网络化的提升,社会对于智能化的需求逐步增加。目前,通信基站天线数量的迅速增长以及人工勘察部署天线的效率低下致使移动通信领域迫切需要实现抱杆上天线数量的自动化检测。所以本文主要研究一种基于计算机视觉的通信基站抱杆上
改革开放以来,我国经济得到快速地发展,工业化和城市化进程不断推进。在流动人口家庭化迁移趋势明显、老人对传统家庭养老模式的偏好及隔代抚育的现实背景下,催生了一个与“北漂”“上漂”等青年流动群体不同的特殊的群体——“老漂族”。随着全面二胎政策的落实,“老漂族”群体的规模将日益壮大,“老漂族”在大城市的生活现状得到了社会的广泛关注,他们面临的融入困境也成为社工领域关注和研究的重要课题。为了深入了解“老漂
中小企业肩负着未来中国经济稳定增长的重任,供应链金融作为重要的融资方式可以帮助中小企业突破自身的规模、背景、财务状况、经营方式等方面的制约获得资金支持。资产证券化产品是供应链金融重要的底层资产,可以将供应链中累积的应收款打包形成资金池,通过循环购买产生稳定的现金流,以此发行债券缓解供应链上的融资难问题。在一个成熟的供应链体系下,核心企业拥有较好的资质和信用水平,因此反向保理业务成为了供应链金融资产
虚拟化是一种管理资源的技术。它的主要目的是在物理硬件上抽象出虚拟的硬件资源,以支持多个操作系统的并行运行。虚拟化技术能够显著地提高硬件资源的利用率,它在云平台技术
随着大数据、5G和物联网时代的到来,对数据的需求日益剧增,而数据的传输依赖有限的频谱资源。频谱共享的实现,离不开对频谱进行观测感知,奈奎斯特采样速率是传统频谱采集的最低要求,面对高频的5G时代,高的采样速率对硬件和资源利用是一个挑战,而压缩感知是一种欠采样的方法可以解决高采样率的问题。目前,用硬件实现欠采样的方法主要有两种:一是调制宽带转换器;二是多倍集采样。而调制宽带转换器在应用场景和器件要求上
目的:探究NUAK2抑制结直肠癌进展和转移的分子机制。方法:我们通过构建敲减和过表达NUAK2的稳转结直肠肿瘤细胞系,进行细胞表型实验:细胞增殖实验,细胞迁移实验,基质胶细胞侵袭实验等探究肿瘤细胞的增殖、迁移和侵袭能力的变化,然后建立裸鼠肿瘤模型进行体内验证。此外,我们还进行实时定量PCR、Western Blot、免疫共沉淀、免疫荧光染色等分子生物学的方法对NUAK2影响结直肠肿瘤细胞的迁移和侵
随着内存键值对象缓存系统在数据中心的广泛部署,动态随机存取存储器(Dynamic Random Access Memory,DRAM)受限于工艺和能耗已无法满足缓存系统对内存容量日益增长的需求。新型非易失性存储器(Non-Volatile Memory,NVM)可以提供比DRAM更高的存储密度和能耗效率,但比DRAM具有更高的读/写延迟以及更高的写能耗。由DRAM和NVM构成的异构内存系统具有提供
功率放大器是无线通信中的重要组成部分,但功率放大器的非线性特性会使信号非线性失真,进而影响无线通信的质量,且功放的非线性特性所导致的谐波、交调等还可能导致其它设备的工作异常。使用功率放大器线性化方法能有效消除功率放大器非线性放大所带来的问题,本文正是围绕数字线性化所展开的研究。首先是基于数字预失真方法的线性化实验。基于实际功率放大器的测试数据,在MALTAB平台中模拟功率放大器的非线性模型;并以多
目的探讨DKK1通过Wnt/β-catenin信号通路对人晶状体上皮细胞(LECs)增殖的影响及其可能的作用机制,为晶状体后囊膜混浊(PCO)的临床治疗提供新的靶点。方法人LECs系SRA 01/04细胞为研究对象,实验分为3组:Wnt3a过表达组,DKK1组和对照组。Wnt3a过表达组采用脂质体介导转染技术将Wnt3a cDNA表达载体瞬时转染入人LECs系SRA 01/04细胞中,构建PCO的