基于深度强化学习的学习资源推荐算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:amyzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会随着互联网的不断发展,学习资源的数量呈指数型上升,种类也多种多样,例如数字图书馆的学习资源、网络课程学习资源等等。在如此多的学习资源面前,用户想要找到最适合自己的学习资源也变得越来越困难,所以如何准确的向用户推荐最适合他的学习资源是一个非常必要的问题。推荐系统是根据用户的需求、兴趣将用户感兴趣的信息(如产品、图书、课程等)推荐给用户的系统。传统的推荐方法在推荐的过程中有很多局限:推荐过程是静态的,忽略了用户偏好的动态变化;大多数推荐系统目标是最大化即时收益得到最终推荐结果,忽略了长期收益的可能;传统的推荐系统倾向于推荐大众化的物品,对没有人交互过的物品或者小众化物品的探索能力不足。深度强化学习能对推荐系统模型进一步优化,深度强化学习的思路和人类学习的思路相近,是通过在某个状态下尝试一个动作,在之后的结果中得到这个动作的回报价值来评价这个动作的好与坏,这个回报价值称为奖励值。将深度强化学习运用到序列推荐中,可以有效地最大化长期收益、对结果进行较好的探索、在线更新用户偏好的动态变化。将深度强化学习引入推荐系统解决了传统推荐系统的诸多问题。本文在现有的深度强化学习方法的基础上,重点研究如何将深度强化学习引入到推荐系统中,通过引入深度强化学习实现对推荐系统的结果进行更好的优化。本文首先提出了一个基于聚类的分层强化学习模型,用于数字图书馆的个性化图书推荐。随后在基于聚类的强化学习模型中引入Q学习,提出了通过Q学习的方式加强推荐系统的模型。本文的主要贡献如下:(1)提出了基于聚类的强化学习模型,并将模型用于数字图书馆的个性化图书推荐。该模型使用了聚类与分层强化学习,聚类可以数字图书馆中的图书进行分类,解决数字图书馆中图书数据稀疏的问题。分层强化学习可以找到借书序列中的噪声数据并删除,使模型能更准确的预测用户的偏好,从而推荐相应的图书。(2)提出了基于Q学习的分层强化学习模型,并将模型用于优化基于聚类的分层强化学习模型。该模型将Q学习与基于聚类的分层强化学习模型结合,在分层强化学习模块中加入Q学习,将分层强化学习中低级任务的奖励值与Q学习中的Q值进行计算,得到更准确的序列中的噪声数据。
其他文献
当前我国汽车保有量大,停车难成为急需破解的民生问题。随着大数据的产生与不断发展,建立智慧停车系统成为解决传统停车问题的有效手段。而县城是我国城镇体系的重要组成部分,县城停车问题又具有一定的独特性,文章立足于县城停车现状,针对县城停车特有问题,以温州市苍南县城新区为例,研究县城智慧停车系统建设方案,因地制宜选取技术手段并配套完善的管理制度与保障体系,缓解县城交通拥堵,提升停车位资源利用率,推进县城数
期刊
癌症亚型的识别对个性化医疗的应用具有重要意义。它致力于使用无监督聚类方法将癌症患者划分为不同的亚型,并为后续的治疗方案提供有价值的参考。近年来,随着测序技术的快速发展,其产生的丰富的多组学数据为在整体水平上发现癌症亚型带来了前所未有的机遇。然而,由于测序技术的限制,组学数据中往往包含大量的噪声。此外,尽管测序成本在不断下降,但仍然难以覆盖大量的样本,这使得目前的组学数据大都呈现出高维小样本特点,并
学位
跨模态由文本生成图像是大数据人工智能领域的重要研究课题,其发展推动了跨视觉和语言的多模态学习和推理的研究进程,是近年来最活跃的研究领域之一,在诸多行业有着广泛应用,如艺术生成、游戏引擎和计算机辅助设计等。根据自然语言描述生成与之语义匹配的图像是一个复杂的计算机视觉和机器学习问题,近年来取得了很大的进展。然而,目前大多数由生成对抗网络辅以语义约束的图像生成网络仅提高了图像的视觉真实性和语义一致性,而
学位
目前的医疗影像任务中,磁共振(Magnetic Resonance,MR)图像的获取存在价格昂贵和耗时长的问题,需要借助技术手段获取多对比度MR图像,如今通过深度学习算法研究磁共振图像的合成以提高诊断效率成为一个炙手可热的话题。随着生成对抗网络(GAN)在近年来的图像处理领域中发挥了重要作用,本文主要将结合生成对抗的方法研究不同对比度磁共振图像的合成。现有的一对一MR图像合成方法中,多数只关注图像
学位
科技与信息化发展致使数据存储量呈“爆炸式”发展,为了解决信息过载问题,推荐系统应运而生。如今,推荐系统被广泛应用到各类电子商务领域及线上购物领域,在提高网站商品转化率、用户选择效率及市场公平性等方面具有重要作用。但是由于推荐系统的脆弱性,部分不法分子在利益驱使下对推荐系统进行有目的的攻击,以使得推荐系统的推荐结果产生偏移。因此,为保障推荐系统的推荐质量与用户对推荐系统的信任度,针对攻击环境下的推荐
学位
抑郁症对人类的身心健康造成极大伤害,甚至危害社会。因此,尽早发现抑郁症早期症状并及时治疗极为重要。抑郁症的早期状态称为抑郁倾向。与大多数正常人一样,抑郁倾向患者会在社交媒体平台上分享自己的故事,表达情绪,以及寻求帮助和支持。因此,海量的社交平台数据为我们挖掘抑郁倾向的特征和发现抑郁倾向患者提供了可能。但是,如何更好地利用社交媒体平台数据,挖掘能够识别用户抑郁倾向的重要特征成为一项难题。尽管目前已有
学位
沪港通和深港通是我国证券市场开放的里程碑事件,研究借道沪深股通投资A股的北上资金,对我国资本市场开放进程尤为有意义。本文理论研究与实证研究相结合,将统计检验、事件研究法、线性回归、多因子模型运用于研究北上资金入市特征,及其持仓股票定价的有效性。通过对2014年11月17日以来沪深股通进行指数分析发现,在样本时期内,北上投资者具备择时能力,他们在指数相对较低的区间买入,在指数相对较高的区间卖出,证金
学位
自从人们进入信息化时代以来,互联网一直在潜移默化地影响着人们的日常生活。电子产品在日常生活中随处可见,微博、淘宝等网络平台为人们获取外界信息提供了便利,同时也产生了大量对时事以及产品的评论文本。文本情感分析是挖掘评论文本表达的情感信息,挖掘其中蕴含的情感信息可以为消费者提供决策支持,有助于商家及时获取反馈信息并对产品进行完善升级,同时有助于政府正确引导舆情风向。因此文本情感分析具有巨大的实用价值。
学位
受互联网技术的覆盖以及移动端设备激增的影响,人工智能逐渐渗透到人们商业生活的方方面面。对话系统作为人工智能领域下的重要产物,得益于数据的支持以及深度学习技术的进步,也逐渐向更人性化方面发展。对话系统从特定领域下的任务型逐渐发展到开放领域下的聊天型,从固定规则下的检索型发展为Seq2Seq框架下对话生成型。综合国内外研究现状,基于生成的对话系统能够脱离规则的束缚生成数据库中没有但合理的回答,且模型的
学位
近年来,机械臂的研究一直是国际、国内极其重视的研究热点,在国家政策的大力支持下,目前,由于我国机械臂及智能系统技术正得到飞速发展,工业机械臂、医疗机械臂的应用得到了进一步推广,这极大的促进了我国工业、国防科技事业的大力发展。在机械臂运动过程中,因为各关节和连杆之间的作用力,产生的柔性效应会导致在执行实际任务时精度降低,所以机械臂的柔性特征是需要解决的首要问题。柔性机械臂是一个具有时变、强耦合等特性
学位