一种基于深度强化学习的推荐算法研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:XIEJUANJUAN1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据、互联网技术和人工智能的迅猛发展,推荐系统在解决信息过载与在线购物和在线内容服务上起着至关重要的作用,其有效性取决于推荐模型或算法对个体用户的独特兴趣和偏好的理解能力。然而,推荐过程是一种用户和系统之间的复杂交互行为,传统的推荐方法经常遇到数据稀少和缺乏互动性等问题。为了解决这些挑战,本论文提出了一种基于深度强化学习的推荐算法研究,主要通过构建基于马尔科夫决策过程的动态推荐模型。它能够在与用户的持续互动中不断改进推荐策略,该模型是一种多模态特征提取和带有负反馈的深度强化学习的动态推荐模型,从而突破传统静态推荐算法的局限性。其主要工作如下:1、针对数据稀少问题,本文使用了Bert模型、vgg-16和卷积神经网络多模态信息提取方法。利用Bert模型来从电影中提取有价值的文本特征信息,利用vgg-16模型来从电影海报中提取相关的图片特征信息,利用卷积神经网络来从电影中提取基本特征信息。这种多模态方法旨在解决数据稀少的问题。通过结合多种信息来源,从而对电影有更全面的理解来提高推荐模型的整体质量。2、利用深度强化学习算法,再加上推荐系统中的负反馈(比如观看了所推荐的电影为正反馈,用户对所推荐电影没有任何操作称为负反馈),在提高用户满意度、改善推荐准确性和准确定位方面均有很大提高。通过利用深度强化学习技术的力量,该模型能够动态地学习并适应用户的偏好,从而提供更加个性化的推荐。3、在豆瓣电影数据集上进行了实验。将所提出的方法与基线模型做了对比,其结论是该方法对于推荐系统来说是有提升效果的。
其他文献
随着网络技术的不断发展,通信成为人们正常生活中提升效率的重要技术。但是,大数据时代数据的爆发式增长为恶意个人收集通信领域用户的隐私数据提供了机会,用户身份与数据的隐私问题逐渐暴露出来。非透明的中心化通信机制由于通常存在单点失效、隐私被窃取和易被黑客攻击的缺点,难以解决通信过程中的隐私安全问题。而区块链技术的不断发展,为解决通信过程中隐私安全问题提供了新思路。通过对传统通信模式与基于区块链技术的通信
学位
随着当今社会的迅速发展,数字化和信息化的程度越来越高,信息的安全与共享问题被越来越多的人所关注。区块链技术的快速发展,人们发现区块链技术具有去可信第三方的共信特性,区块链的数据对所有人公开,任何人都可以通过公开的接口查询数据,整个系统的信息高度透明,且数据拥有者(即用户)可以自己控制数据,而不是将数据交由不可信的第三方保管。于是人们利用区块链技术,在一定程度上解决了信息的安全共享问题。但是新的问题
学位
“十四五”规划纲要提出的推动“产业数字化”标注着数字化转型上升为国家层面的政策,体现了数字化转型政策地位更高。目前对企业数字化转型经济后果研究方兴未艾,基于行业间的关联性,企业的风吹草动会对审计行业产生一定程度的影响,企业战略也是审计师在制定审计决策时需要考虑的关键问题。因此,本文探究数字化转型与战略差异度的交互作用对审计师的审计投入产生的影响。本文选取2007-2020年沪深A股非金融类上市公司
学位
当前,我国居民财富分配差距显著,为了实现共同富裕的模式,国家不断出台财富三次分配的相关政策。目前,基于财富三次分配的研究中,国内专家学者多集中于对现有政策的理论研究。本文基于多智能体系统(Multi-Agent System,MAS)理论,利用多智能体技术模拟经济领域演化过程,分析财富三次分配的影响因子,能对即将出台的相关政策进行前瞻性分析,模拟仿真政策带来的影响作用,对于共同富裕模式的实现具有重
学位
随着科技的飞速进步,数据的产出量已经达到了史无前例的水平,而且这些数据可以被大量地收集、存储,因此,不同行业对于数据的处理需求也日益提升。在机器学习和数据挖掘领域,分类技术被广泛应用,它可以帮助我们快速、准确地识别出复杂的信息,而这些技术可以通过多种机器学习方法来实现。数据分类技术已经成为智能化处理的重要工具,它可以有效地帮助我们更好地识别和预测数据集上的各种类别,从而大大提高数据分析的工作效率和
学位
随着科技的发展,各行业数据的收集和处理变得越来越容易,而迅速整理和挖掘数据中隐含的信息,不仅能够有效提升各行业的智慧数据处理技术能力,还能够为相关行业的发展提供强有力的支撑。随着数据量的不断增加,数据的分布逐渐呈现出不平衡的趋势,相对于数据集中占比较多的样本,样本数量少的一类才是人们需要深入研究的重点。如在医学检测、垃圾邮件过滤、银行卡防欺诈等方面,数据分布的不平衡更是普遍存在,有效地解决这一问题
学位
当前,5G网络广泛应用,6G网络研究备受关注,但硬件网络发展缓慢,需研究网络虚拟化技术以实现资源共享,其中虚拟网络嵌入问题是关键挑战。为了满足和平衡网络服务提供商和用户的需求,所设计的虚拟网络嵌入算法需要尽可能的提高网络服务提供商的收益和用户的体验。针对现有的方案的优化目标通常集中在单一指标或多个指标的简单组合上,难以合理的进行虚拟网络请求的嵌入,实验结果也不尽如人意。本文提出了两种基于图神经网络
学位
在现代雷达电子对抗的信息战场上,面对信号高度密集、新体制雷达日益复杂的电子对抗环境,以常规参数为基础的雷达辐射源信号分选识别已经难以取得令人满意的效果;基于数学变换域的雷达脉内特征提取方法虽然有很高的研究热度,但建立有效的雷达信号序列表征分析模型仍然是一个难点,这不仅直接影响了辐射源信号分选和识别的性能,还给现代化的雷达情报侦察带来了新的挑战。因此,在复杂的电磁环境中,如何探索和研究雷达辐射源信号
学位
深度强化学习算法将传统强化学习与深度学习两者结合,是目前解决高维决策任务的一类典型算法,已在各领域广泛应用并取得了突破性进展。但是传统的深度强化学习在面对长时间间隔决策游戏以及长间隔决策中需要智能体定点导航的长时间间隔游戏表现不佳,本文针对此问题做出了如下研究:本文提出了融合门循环单元的深度循环Q网络以解决在智能体长时间间隔决策中表现不佳的问题。智能体只能通过有限的画面做出的决策,会出现之前游戏画
学位
传统的物联网访问控制模型大多是基于集中式的可信实体构建,存在决策过程不透明、动态扩展性差、设备拥有者自主性差等问题,无法满足轻量级、海量异构、动态性接入的物联网复杂计算环境。随着区块链技术的发展,因其具有去中心化、防篡改、可追溯等特性,为物联网访问控制实现安全、高效的数据交互和访问决策提供了新的解决方案。因此,本文以ABAC模型为基础,提出一种基于区块链的物联网属性访问控制模型。通过将区块链技术和
学位