【摘 要】
:
5G的到来再度提高数据的产生速度,信息过载的问题将进一步加剧,电子商务行业发展迅速,覆盖面越来越广,商品种类日益丰富,用户数量日益庞大,买家如何找到自己心仪的商品,卖家如何向买家展示商品都出现了阻碍,推荐系统是解决这一问题的良好方法。然而以往的推荐算法大多将推荐过程看成一个静态的过程,这与实际不符,推荐应该是一个推荐系统与用户不断交互的过程。强化学习的发展可以较好的解决动态互动的问题,且推荐的过程
论文部分内容阅读
5G的到来再度提高数据的产生速度,信息过载的问题将进一步加剧,电子商务行业发展迅速,覆盖面越来越广,商品种类日益丰富,用户数量日益庞大,买家如何找到自己心仪的商品,卖家如何向买家展示商品都出现了阻碍,推荐系统是解决这一问题的良好方法。然而以往的推荐算法大多将推荐过程看成一个静态的过程,这与实际不符,推荐应该是一个推荐系统与用户不断交互的过程。强化学习的发展可以较好的解决动态互动的问题,且推荐的过程恰好是这类问题。因此,本文构建了一个基于强化学习的淘宝商品推荐系统,并用淘宝的用户行为数据对该系统进行训练与验证。具体地,该系统通过如下方式建立:首先,本文建立数据池,将用户行为涉及的商品及用户反馈数据输入神经网络,并在神经网络中对数据进行特征提取,得到用户的喜好特征。其次,本文建立了一个基于生成式对抗网络的模拟推荐环境,可以模拟推荐系统与用户的交互过程,该网络的生成器生成推荐动作,判别器模拟用户反馈。接着,本文建立基于强化学习的淘宝商品推荐系统,用马尔可夫决策过程对淘宝商品推荐过程进行建模,并建立DNQ模型求解推荐过程。在DNQ模型中,本文建立了Q网络和target-Q网络用于预测Q-Learning过程不同状态与动作组合的Q值,并用淘宝的用户行为数据及模拟推荐环境生成的数据对模型进行训练。最后,本文用测试集对训练好的模型进行测试,得到推荐的五步累计奖励值的平均值较高,模型推荐效果较好,通过实验结果,本文发现基于强化学习的推荐系统能够较好的预测用户的行为,提供的推荐内容获得的累计奖励较高,而多样性和覆盖率方面效果则不是很好,仍待提高。
其他文献
近年来,服务企业之间的竞争越来越激烈,能为企业带来竞争力的不只是产品或服务了,还包括那些扮演企业兼职员工角色的顾客,这些顾客自发地做着对企业有益的行为,如推荐产品或服务给他人、积极反馈建议、帮助其他顾客更好的完成服务等,这些行为为企业带来的价值日益得到重视,因此,在引导顾客公民行为上,企业可以依赖哪些方法也被学者们重视。而在服务行业,通过创建更好的服务场景来引导顾客行为、吸引顾客被认为是重要且可行
区域一体化体现为一种有影响力的增长战略,该战略为新兴产业的发展提供了相似的广阔市场,并通过增加国民收入和议价能力消除了外部冲击.在非洲,全球和区域两级更加多样化的农业贸易可以为提高价值链上各阶段的生产力提供杠杆,并促进农业转变为高生产力部门,为生产者提供足够的收入,刺激整个经济的增长。增加农业贸易也有可能改善粮食安全,并有助于稳定地方和区域粮食市场,减小市场受冲击的威胁。非洲国家正在寻求增加国内生
随着大数据和人工智能技术的发展,我国智慧法院的建设如火如荼。在司法智能化领域,大数据技术可以服务于案件审判、判决执行和司法管理。本文以北京市法院2020年公开的民间借贷纠纷案一审判决书为例,结合要素抽取、描述统计、相似度计算和文本分类等文本挖掘技术,探索出一套可推广的民事案件研究方法,达到识别类似案件和预测胜诉率的目的。该成果可在庭审前预判案件的胜诉概率,辅助当事人及时调整诉讼方案。这既能降低当事
随着经济高速发展和人民物质水平的提高,旅游业蓬勃发展必将带来住宿行业用户的不断增长,而住宿行业线上渗透率远低于机票、火车票等旅行服务,说明在线住宿行业仍有较大的发展空间。目前在线酒店预订行业形成了携程、美团、飞猪三足鼎立的局面,三方在商业上的打法各有不同,但都在为争夺在线酒店预订市场做出各自的努力。而在线酒店预订的核心场景是房型推荐,该场景能否精准且快速地满足用户对房型的需求对于在线预订服务网站的
现阶段我国经济发展水平虽与日俱增,但经济发展不平衡的弊端也渐渐显露出来。消费内需不足,经济发展更多的倾向于依靠投资和贸易带动,限制了经济的平衡和持续性发展。居民的储蓄在很大程度上是预防未来可能发生的不确定危机,主要是养老方面的支出并不确定,所以居民在现期消费的信心就会大幅减弱。养老问题是每个居民都将会面临的社会性问题,我国又处在老龄化日趋严峻的阶段,人口预期寿命也在增长,如何在保障人们基本生活水平
<正>1 研究目的(Objective)锂金属是21 世纪最有应用潜力的金属,广泛应用于高能电池、储能、航空航天、受控核反应等多个新兴行业和领域。因其重要的工业和经济价值,美国、日本和欧盟相继将锂列入国家战略性或关键性矿产,并在全世界储备相关资源。在此背景下,我国也出台了对应政策,并加大了国内锂矿资源的勘查和开发。
目前我国人口老龄化程度持续加深,老年人口对于社会保障及养老体系带来巨大压力和挑战。家庭结构小型化导致家庭养老模式在面对老年人日益增长的多样化养老需求时供给不足,同时机构养老模式由于各种主观因素和客观因素导致不被老年人普遍接受。为了缓解我国养老的巨大压力,国家出台了相关政策法规来促进我国养老事业的发展,社区居家养老模式应运而生。社区居家养老模式可以通过家庭和社区的共同支持有效缓解养老压力,但目前我国
随着Web2.0技术不断发展,互联网进入了大数据时代,数据价值越来越突显其重要性,传统数据挖掘主要关注于结构化数据,近年来,非结构化数据的研究和应用逐渐受到重视。文本数据作为互联网中最基本数据类型,蕴含了巨量的价值信息,而情感分析是自然语言处理的重要分支,其在舆情监控、市场营销、欺诈识别、经济预测等诸多领域均有着广泛的应用。基于此,如何透过文本数据给出更多有用的情感分析是需要我们深入探讨的问题,有
十一届三中全会以来,中小企业逐渐成为我国国民经济发展中的重要组成部分,中小企业的健康发展有助于促进科技创新、增加社会工作机会和提高人民生活质量,但是当前我国中小企业的壮大遇到了一些阻碍:中小企业在经营过程中常常遇到一些问题、极易受到外部突发经济状况的影响,经常面临资金短缺的问题;另一方面,我国中小企业发展质量普遍偏低,以低端产业为主,缺乏核心竞争力。在进行供给侧改革和新旧动能转换的背景下,中小企业
批发零售业为我国第三产业的重要行业,是生产者和使用者的桥梁,近年来成长速度极快,在整个社会生产总值中的占比逐年上升。而最新数据表明,截至2020年6月末,批发零售业以12.88%的不良贷款率居于行业首位,且较上年末增加2.43个百分点,因此对我国批发零售业企业的信用风险评价十分必要。本文首先基于批发零售行业的宏观经济数据,对我国批发零售业的现状和发展趋势进行统计分析。又通过考量影响企业信用风险的财