基于排名多臂赌博机的推荐算法研究

来源 :南宁师范大学 | 被引量 : 0次 | 上传用户：bmw

【摘要】

：

【作者】

：

刘春霞

【出处】

：

南宁师范大学

【发表日期】

：

2020年01期

【关键词】

：

推荐系统排名多臂赌博机堆栈降噪自动编码器标量方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的高速发展,网络上的信息资源纷繁复杂并呈现爆炸式增长的趋势。推荐系统(Recommendation System,RS)由于具有信息过滤的特点,得到了各领域学者的不断研究。传统的推荐算法对用户偏好的挖掘主要通过分析用户的历史性,在项目候选池与用户池相对静止的场景下能够取得优秀的效果。目前,大量的推荐行为都是通过实时在线的方式完成的,这就要求推荐系统能够及时对用户反馈进行响应,并在一段时间做出连续推荐。传统推荐算法对这种在线环境的动态性难以适应,从而导致了“探索-利用”问题。多臂赌博机(Muit-Arm Bandit,MAB)能够动态处理数据,使用连续的反馈信息不断更新策略,很好地处理“探索-利用”的平衡问题。因此,本文将推荐问题建模为MAB问题,赌博机中的臂对应于要推荐的项目,奖励对应于用户是否点击了推荐的项目。虽然MAB具有优秀的理论支持和应用效果,但现存基于MAB的推荐算法仍具有一定的局限性。其一,每次推荐时仅推荐一个项目,这不符合日常生活中的推荐形式。第二,推荐的项目仅考虑其准确性,忽略了其他评测指标。本文为解决现存基于MAB推荐算法的这两个局限性,提出了基于排名多臂赌博机的推荐算法,试图在一个算法中同时解决这两个问题。1.针对传统MAB算法在每次推荐时仅推荐一个项目的问题,将排名多臂赌博机(Ranked Bandits)引入到算法设计中。Ranked Bandits算法将每个排名位置对应一个独立的实例化的MAB算法。2.无论是传统的MAB还是Ranked Bandits算法,其核心思想都是优化臂的选择,即仅关注推荐的准确性,忽略了其他指标。一个好的推荐系统除了推荐的准确性外,还需要关注其他评测指标,如多样性、新颖性等。因此,本文在引入Ranked Bandits算法的基础上,将算法的设计分成了四个子模块:标量化方法、指标选择、加权方案、MAB算法选择。本文选择了线性的加权求和法为准确性、多样性与新颖性三个指标进行加权,并根据.不同的情况,从用户与排名两个角度对这三个指标设置不同加权方案。值得注意的是,原则上任何MAB算法实例化后都能适用于本文提出的算法,但不同的MAB算法选择对算法的性能有所影响。因此为提高整体算法的性能,本文对现存的CONLINBA算法进行了改进,引入深度学习模型——堆栈降噪自动编码器(SDAE)代替LDA算法来获取项目特征,生成了新的实例化算法。最后,在两个公开的数据集Last.fm与Delicious上,对本文提出的基于排名多臂赌博机的推荐算法进行实验验证。实验结果表明,引入深度学习模型SDAE后生成的实例化算法在一定程度上优于LinUCB、MFLinUCB与CONLINBA算法,体现了 SDAE算法获取特征的优势;基于排名多臂赌博机的推荐算法在一定程度上优于仅关注准确性的Ranked Bandits算法,说明了同时考虑多个指标的算法对推荐性能产生了积极作用,符合对本文算法设计的期望。

其他文献

卡拉贝利大坝三期截流方案设计

文章结合现有截流施工技术和拉贝利大坝三期截流实际施工条件,对卡拉贝利大坝三期截流施工方案进行了设计。通过计算,明确了截流时段和截流流量,并通过综合比较各截流方案施

期刊

卡拉贝利大坝截流戗堤水力计算龙口分区新疆

DXD再担保公司发展战略研究

DXD再担保公司作为全国第一家区域性再担保公司,十年的经营,为振新东北老工业基地、有效促进中小微企业发展、支持实体经济的发展,改善当地金融环境做出了努力和贡献。融资担

学位

DXD再担保公司中小微企业增长型战略

陕西线辣椒炭疽病的发生现状与防治对策

陕西省关中地区是我国线辣椒的主产区之一。近年来,随着辣椒产业的持续发展,炭疽病呈现逐年加重的趋势,严重影响辣椒产量及品质,个别地方其经济损失达到80%左右。辣椒炭疽病

期刊

线辣椒炭疽病防治技术

CD105在大肠癌中的表达及其临床意义

目的探讨CD105在大肠癌组织中的表达及其大肠癌组织中新生血管生成与肿瘤的一些临床病理指标之间的相关性，通过测定大肠癌中微血管密度(MVD)来探讨肿瘤中新生血管生成与肿瘤的

学位

CD105血管生成MVD大肠癌VEGF

电场及“电场-腐殖质”耦合作用下的土壤水分运动

土壤水分运动与农业生产、环境保护等诸多方面密切相关,因而土壤水分运动一直是学术界研究的热点问题。自Darcy定律提出至今,虽然国内外学者已经建立了众多土壤水分入渗模型,并试图实现对土壤水分运动的准确描述,但人们很快发现,由于土壤本身和土壤水分运动的复杂性,很难找到一个普遍适用的数学模型实现对土壤水分运动的准确描述。于是,人们开始着眼于水分入渗过程中土壤内部机理研究,试图从影响土壤水分运动的因素和机

学位

土壤电场腐殖质(HA)耦合作用水分入渗

我国石油企业技术创新合作研发演化博弈研究

随着经济全球化步伐的加快,企业与世界经济的联系越来越紧密,市场竞争愈演愈烈,技术创新逐渐成为经济发展的原动力,是提升企业竞争能力的关键要素。近年来,我国石油企业日渐

学位

石油企业技术创新合作研发演化博弈帕累托优化

玉树断裂几何学、运动学特征与古地震研究

甘孜—玉树断裂带是青藏高原东南缘鲜水河断裂带的北西向延伸部分。前人对甘孜—玉树断裂带的研究主要集中在其东段甘孜断裂上。西段玉树断裂由于之前被认为不是晚第四纪活动

学位

玉树断裂甘孜-玉树断裂鲜水河断裂滑动速率古地震几何分段滑动分解非特征地震事件

论移动音乐应用的公共联结

伴随着中国手机网民规模的不断增长及国内数字音乐市场的飞速发展,移动音乐应用应运而生。区别于传统音乐服务,如今的移动音乐应用为用户提供的已不仅仅是音乐下载和储存等功能,它更是一个集论坛、微博、社交网络等功能于一身的新型互联网公共广场。这意味着,移动音乐应用除了拥有传播音乐的价值外,还具有联结公众的意义。本文以网易云音乐为例,关注其中的音乐社交活动,旨在探究以此为例的移动音乐应用如何通过交互界面建构的

学位

网易云音乐交互界面公共联结共同生活

基于链路预测的社交网络研究

链路预测作为数据挖掘的一个分支,为复杂网络和信息科学的联系提供了桥梁。链路预测的一个重要目标是:实现信息科学中缺失信息的还原和预测。链路预测不仅在学术上推动了信息

学位

复杂网络链路预测网络结构相似性

低油价助美国航空业盈利大增

<正>自2014年11月以来的国际油价下跌,以及今年上半年以来的一直处于较低油价让全球航空业受益。2015年6月22日美国交通部公布美国航空公司2015年Q1财务经营数据,美国航空公

期刊

美国航空公司公司运营美国交通部低油价净利润

基于排名多臂赌博机的推荐算法研究

与本文相关的学术论文