融合用户评论主题的在线课程推荐研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:rmbsaxn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代科学技术的迅猛发展,推动人类社会全面进入了信息时代,教育的时空界限也在不断被打破,在线教育随着互联网技术的普及在我国快速的发展。然而,在线教育的发展为学习者带来海量学习资源的同时也带来诸多困扰。随着在线课程资源的不断增加,用户往往需要花费大量的时间和精力去搜索查找想要的在线课程。个性化推荐技术(Personalized Recommender)就是利用用户本身的特征信息模拟售货人员在现场销售时为客户推荐买什么的过程。协同过滤推荐(简称CF)可以说是目前使用的最多的个性化推荐技术之一,它主要是根据当前已有的信息来计算用户或项目之间的相似度,并基于此来预测用户对项目的喜好程度,从而实现推荐的整个过程。评论是网络用户在平台上表达自己情感与观点的载体,其中包含了体验感受、功能请求和错误报告等信息。如果能够将用户发表的对于课程的评论内容融合进来,将获得更为精准的用户或课程之间的相似度,从而实现更有针对性的课程推荐。但是网络上的用户评论大都是杂乱无章甚至没有内容的,有些仅仅是评论者情绪的表达,或者有些“长篇大论”中也许存在着用户想要表达的关键信息,但需要耗费大量的人力来进行阅读理解并提炼。因此,需要有其他更经济更有效更全面的方法来挖掘用户评论的主题,并且将其应用到协同过滤推荐算法中,从而实现更精准的课程推荐。正是在这样的背景下,本文将在线课程推荐研究的对象聚焦于用户评论,将其融合于传统的基于课程评分相似度的协同过滤推荐中,以提高推荐的精度。首先,运用传统协同过滤推荐算法根据已有的评分信息来计算课程之间基于用户评分的相似度。其次,通过主题模型提炼用户评论内容主题,并将评论内容的主题作为课程潜在属性生成课程的特征画像,从而根据课程的特征画像获得课程之间基于用户评论主题的相似度。对于用户评论内容主题的发现,在隐含狄利克雷分布(LDA)模型仅考虑词出现概率的基础上,引入Word2Vec词向量模型将隐含狄利克雷分布(LDA)模型产生的“主题-词”矩阵转换成“主题-词向量”矩阵,并运用K原型聚类将词向量(数字特征)与主题分类(文本特征)有机地结合起来对“主题-词向量”矩阵进行聚类,从而获得带有词语义信息的课程评论主题,并基于此计算得到课程融合用户评论改进主题的相似度。再次,运用多元线性回归模型将课程评分的相似度与融合用户评论改进主题的相似度进行拟合,从而获得汇总加权的课程之间的相似度,进而预测用户对课程的评分。最后,将基于课程评分相似度的协同过滤、融合用户评论主题的协同过滤和融合用户评论改进主题的协同过滤预测分数结果进行比较,并进行分析。经验证,将用户评论主题加入到课程相似度的计算之后,提高了课程评分的预测精度,改进了在线课程推荐的效果。并且,将运用改进主题模型挖掘出的带有词语义信息的课程主题加入传统的课程相似度计算之后,在线课程评分预测的精准度能够有进一步的提升。从实际应用的角度来看,与一般意义上的商品推荐中用户会进行重复购买不同,用户不会对已经学习过的课程感兴趣,仅仅通过使用协同过滤推荐预测的课程分数来进行课程推荐是远远不够的,因此需要将其与其他的推荐算法如信息检索技术进行结合运用。本研究的创新举措大概可以归纳成这样几点。第一,将用户评论内容的主题作为课程潜在属性生成课程的特征画像,从而根据课程的特征画像获得课程之间基于课程评论主题的相似度,提高了在线课程评分预测的准确性。第二,在发现用户评论主题的时候,考虑了词之间的语义关系,运用Word2Vec词向量模型将传统隐含狄利克雷分布(LDA)模型生成的“主题-词”矩阵转换成“主题-词向量”矩阵,从而更进一步提高课程评分预测的精度。第三,使用K原型聚类将词向量(数字特征)与主题分类(文本特征)有机地结合起来对“主题-词向量”矩阵进行聚类,从而获得聚集的带有语义信息的课程评论主题,使得到的课程相似度更接近现实。第四,运用多元线性回归模型将课程评分的相似度与融合用户评论改进主题的相似度进行拟合,从而获得汇总加权的课程之间的相似度,进而预测用户对课程的评分。
其他文献
工程更改指的是在某种产品从项目策划到生命周期结束,所有的生产与销售运行结束的整个过程中,对这种产品和技术工艺文件进行变更的活动的总括。产品的法律法规认证、产品质量改进、环保排放要求、产品更新换代等,都会引起产品的相应工程更改,并且每一次的工程更改基本都会与研发、采购、质量、生产、售后有关。工程更改是各个制造企业的基本业务,并且是重要业务。如果产品升级出现错误、用户需求发生变化、供应商发生变化、产品
学位
核电“走出去”是践行“一带一路”倡议的重要举措,也是我国的国家战略。海外核电工程影响因素众多,在目前我国已经掌握具有自主知识产权的三代核电技术“华龙一号”,拿到了核电技术出口的通行证的基础上,通过最为合适的项目管理模式参与到海外核电工程的建设,以顺利完成质量、进度及成本目标,对于中国核电“走出去”至关重要。目前对项目管理模式的研究大多集中在普通建筑工程领域,对核电项目管理模式的研究则多是集中在对当
学位
上市公司财务欺诈在国内外都是一个严重的问题,并且对整个资本市场的各个方面包括企业自身、投资者甚至是审计监管机构都有着极大的危害。而由于财务造假具有一定的隐蔽性,往往在一家公司发生欺诈行为的多年后才会被查出并予以处罚,因此构建一个能够准确及时识别出具有财务造假行为的上市公司的模型,在第一时间减轻财务造假带来的损失,是对资本市场的各个方面都非常有意义的。本文选取了2016-2018年因财务欺诈的相关问
学位
《ERP沙盘实训》课程是一门模拟企业经营对抗性的综合实训课程,由线下教学转为线上教学后,为达到与线下教学的同质等效,需要解决教学方式改变、线上实训场景搭建、考核内容多维实效评价、小组团队协同等问题。为此确定了采用高绩效教学理念,提出结合新的授课方式重构实训项目、多平台协同应用、项目实操讲练评相结合、考核设计等措施进行教学实施,获得了良好的教学效果。
期刊
人们健康意识不断增强,但我国医疗资源却相对匮乏且不平衡,尤其经过新型冠状病毒疫情,人们对互联网医疗服务的需求急剧增长。患者通过在在线医患问答社区中发布问题或浏览历史记录,即可得到医生的病情分析与治疗建议,解决出门排队看病的部分难题并减少线下门诊机构的压力。在众多疾病分类中,存在一种康复类疾病。对于康复患者而言,由于疾病痊愈周期长,他们无法一直在医院接受治疗,因此对通过从在线医患问答社区中获取日常生
学位
随着互联网的广泛普及、经济的飞速发展以及人们受教育水平的逐步提升,线下获取知识的方式已经不是人们可以选择的唯一方式了,线上获取知识的途径日益丰富,同时,伴随着信息爆炸,人们越来越倾向于为高质量的知识付费来节省时间成本与注意力成本。知识交流平台作为一种重要的互联网交流社区,对互联网用户十分重要,因为其为用户们提供了非常重要的在线学习与分享知识的途径。如何维持知识交流平台上的用户进行积极的、活跃的参与
学位
金融市场的资产价格形成机制复杂。受到宏观与微观因素的影响,金融市场的环境总是处在不断地变化之中,这种非平稳的特性使得仅用单一策略刻画金融市场的算法(如ARMA、SVR、NN等)往往在样本内外存在着较大的差异性。为了解决环境非平稳的问题,强化学习的技术被引入了金融市场的在线动态决策问题中。强化学习(Reinforcement Learning,以下简称为RL)是一个智能体在与环境交互的过程中,通过与
学位
当前A股市场呈现出明显的“资金抱团”特征,即市场中大部分投资者的资金集中涌向白酒等抱团板块,不论机构或是个人的资产集中度都相应提升。这种资产集中度提升的另一面则是非抱团股票的普遍下跌,资金抱团与股指波动到底存在怎样的关系?抱团紧松与股价涨跌谁先谁后?考虑到现有关于抱团的研究较少,较多研究方法是基于基金、上市公司季报数据开展的量化分析,面临着信息披露度不足且滞后的问题,且较难刻画散户投资者或全市场对
学位
近年来随着我国金融市场逐步成熟,越来越多的股民涌入A股市场。散户投资者大多缺乏专业的投资知识,投资操作受情绪因素影响严重,容易出现追涨杀跌及羊群效应等现象。同时,中国股市具有明显的“牛短熊长”的特征,多轮的牛熊转换,使得大部分个人投资者难以适应大盘走势的快速变化,风险暴露往往较高,难以在获得长期稳定的收益。近年来计算机编程技术的高速发展,量化投资策略逐渐得到各方投资者的关注。量化投资是理性的投资策
学位
在经济学中“效率”一词占据着重要地位。资本市场融资效率也是资本市场理论的核心内容。研究一个国家的资本市场融资效率,能够在一定程度上正确认识和客观评价该国家的资本市场状况。近年来,柬埔寨股票市场逐步发展,为柬埔寨企业股权融资作出贡献。但柬埔寨企业过度依赖债务融资,这种单一化成为了企业融资及企业资本结构的关键问题,极大的制约了柬埔寨企业及柬埔寨股票市场的稳健发展。因此,研究柬埔寨股票市场股权融资效率的
学位