基于强化学习的教育资讯个性化推荐系统研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:liuzixing0210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展使得网络信息资源日益庞大。对于用户而言,海量的数据信息严重干扰其对信息的正确选择,因此信息利用率非常低。对于企业而言,满足用户个性化需求对其扩大用户规模具有不可替代的作用。推荐系统可有效解决信息过载问题,提供个性化服务,因此无论对于用户还是企业,个性化推荐系统的研究都具有重要的影响和意义。本文为获得更好的推荐性能,将强化学习方法应用到推荐算法中进行了研究,同时针对企业需求,设计和实现了基于强化学习的教育资讯个性化推荐系统,具体工作如下:(1)针对推荐算法需适应用户行为特征变化,捕捉用户兴趣演变的问题,提出了一种基于强化学习和生成对抗网络的推荐算法(Model-based Reinforcement Learning with Generative Adversarial Networks and Attention Mechanism for Recommendation,MRLG Rec)。由于无模型的强化学习方法需要与真实环境频繁交互,代价较大,因此本文采用了基于模型的强化学习方法。本文在采用注意力机制充分提取用户状态特征的基础上,基于生成对抗网络构建了一个用户模拟器,用以模拟用户与推荐智能体之间的交互过程,并将这个模拟器作为强化学习的环境模型,进行推荐策略的学习。对比实验表明,所提用户模拟器能够适应用户的行为特征变化,获得较高用户行为预测准确率,基于此用户模拟器的推荐算法也获得了较高的点击率和长期奖励,有效提高了推荐性能。(2)针对企业需求,设计并实现了一个基于强化学习的教育资讯个性化推荐系统。本文首先分析了教育资讯个性化推荐系统的功能和性能需求,进行了总体架构设计和模块设计,将系统分为数据采集模块、数据存储模块、算法模块和系统业务模块;然后将所提算法MRLG Rec应用于此系统,实现了基于强化学习的教育资讯个性化推荐系统;最后进行了算法效果验证和系统测试,验证了该系统在功能和性能方面的有效性。
其他文献
近些年来,光子晶体光纤(PCF)因为其可灵活设计的特殊结构而具有不可比拟的优势,吸引了越来越多学者的关注,有关PCF的研究与应用也在逐步取得进展。PCF具有很多普通单模光纤没有的一些光学特性,如大模场面积、色散可调、高双折射率、低损耗以及高非线性等等。尤其是非线性性能方面,通过灵活的设计PCF的包层结构,能使光纤的非线性系数得到很大的提升,相比于普通光纤能高出数个数量级。非线性效应包含很多种类,受
由于全球智能移动终端数量的迅速增多以及万物互联的慢慢普及,现有的通信速率不足以满足当下这个信息爆炸时代的需求。如今5G的部署在世界各国正在如火如荼地进行,同时一些通信强国也已经启动了 6G项目的设计与研发。早在2018年10月,我国就已经开始了 6G相关的研发工作。整个1G到5G的系统技术都是基于蜂窝网的,由此作为突破点,“去蜂窝”网络架构成为了 6G主要变革方向之一,并得到了学术界越来越多的关注
随着云计算和大数据时代的到来,高度集中的数据和移动服务迅猛增长,底层光网络基础设施所承载的互联网流量对服务的需求不断增长,这刺激着对网络容量扩展的探索。鉴于现有的复用技术已达到其扩展性极限,空分复用技术展现出很大的潜力。与具有有限传输能力的单模光纤相比,少模光纤可以作为空分复用网络的空间通道并提供多模式传输。同时,熊猫型保偏光纤因其偏振保持特性良好、制作工艺简单及损耗较低等优点而被广泛地研究与应用
在大数据时代,医疗、交通、通信等各行各业的数据扑面而来,信息的呈现形式也趋于多元化。面对海量的数据,广义粗糙集理论与方法能够有效地从中挖掘有用的信息并用于数据处理与分析,提高信息获取的能力。本文在覆盖粗糙集理论的基础上,将商空间理论与粗糙集理论结合起来,研究了商空间上的覆盖及其相关算子与矩阵计算方法,建立了粗粒度信息空间与细粒度信息空间之间的联系,解决了粗粒度信息空间中粒子的描述问题。商空间及其上
无人机基站凭借其灵活、高移动性的优势可以为无线设备提供高可靠、低时延的通信服务。相较于单无人机系统,多无人机通信系统可以显著地提升工作效率,进而成为了当前的热点研究方向。当多个无人机基站在区域内共同提供数据传输服务时,如何合理地分配服务区域、动态调整无人机数据采集模式及飞行轨迹将显著影响通信过程中的数据服务量与任务完成速率,因此引发了研究领域的广泛关注。本课题针对提升多无人机基站工作效率与网络性能
随着移动通信和汽车产业的快速发展,车联网(Vehicle to Everything,V2X)通信技术受到了科研学者和相关组织的广泛关注。当前,面向第五代(the Fifth Generation,5G)移动通信技术的V2X标准化工作已经在第三代合作伙伴计划(the Third Generation Partnership Project,3GPP)等国内外标准化组织的推动下全面展开。其中,资源调
相比较传统无线通信网络,车联网(Vehicle-to-Everything,V2X)具有节点移动性高、通信环境复杂、频谱资源更有限等特点,因此需要设计针对V2X的拥塞控制策略。基于优先级的通信作为车联网提供服务质量(Quality of Service,QoS)支持的方法之一,通过为关键信息提供更高级别的通信保障,提高V2X中的通信质量及无线通信资源的利用效率,在拥塞控制中也有一定应用意义。基于上
随着整个社会的信息化的不断发展,互联网的规模也在不断增大。研究网络流量分类算法并建立相应的网络流量分类系统能够产生巨大的社会价值以及经济效益,并对通信网的发展具有重大意义。随着互联网技术的不断发展,各种新型的网络应用不断地被开发出来,而且它们自身都具有独特的流量特征,这使得在通信网中进行传输的网络流量数据的特性变得更加复杂,对网络流量进行有效的分类和管理也变得日益困难。通过网络流量分类技术,将通信
随着互联网和多媒体技术的快速发展,数字音像制品以及其他电子出版物的传播和交易变得越来越便捷。如何在利用到互联网便利性的同时,有效的保护数据的安全与电子出版物的版权成为了一个亟待解决的课题。传统的信息加密技术通过加密算法将明文转换为无法阅读的密文,但这很容易引起攻击者的注意,而且难以应对暴力破解等手段。而音频信息隐藏技术将密文信息隐藏在载体音频中,这不仅能隐藏明文的内容,还能隐藏明文的存在,为保密信
去中心化系统是由高度自治的节点自由连接组成的开放式系统。中心化系统存在着中心服务器成本昂贵、过度依赖主干网、单点故障等问题。相比于中心化系统,去中心化系统则具有成本低廉、数据分布式存储且永久保存等优点。但是,去中心化技术带来好处的同时,也面临以下挑战:第一,去中心化系统中节点间物理距离与逻辑距离不匹配,造成数据传输中的带宽浪费;第二,去中心化系统基于内容寻址,数据查询耗时大、效率低;第三,去中心化