实时推荐中精确性和实时性改进算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jimiewongy2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于互联网技术的快速发展,网络上的数据呈指数增加。人们被海量数据所包围以至于发现感兴趣的信息愈加困难,推荐系统在这种“信息过载”的情形下应运而生。单个推荐模型具有各种局限性,研究人员通常使用一些组合方法将多个推荐模型进行融合,利用多模型的优点来弥补单模型的不足。另外,传统的推荐模型需要定期更新模型,每次推荐的依据都是上次更新前的历史数据,难以满足实时推荐需求,而现实生活中推荐系统面临的问题更多是基于短时期内的数据,这类场景中的物品一般具有短时效性,因此实时推荐变得愈加重要。本文的主要工作有以下几个方面:(1)本文研究了推荐系统中常用的模型组合方法,并提出了一种混合多模型的协同过滤算法,在算法中提出了“虚拟邻居物品”。该算法使用协同过滤的思想将多个模型进行组合,克服了传统基于物品的协同过滤算法的局限,可以有效提高推荐精度。矩阵分解模型和受限玻尔兹曼机模型是效果比较好的两个单模型,本文主要选择这两个模型以及它们的一些扩展版本进行组合。实验中首先对四个单模型参数调优,然后对比四个单模型的效果,最后选择效果最好的两个模型通过本文所提算法进行组合,并与常用的其他模型组合方法做对比实验。(2)本文提出了一种基于用户行为权重的实时性改进算法,通过时间窗口对最近一段时间内的用户行为建模,充分利用用户行为数据的时间维度信息为不同时刻的行为赋予不同权重,使越靠近当前时刻的行为权重越大,从而对推荐结果的影响也就越大,使推荐结果更能体现与用户当前行为的关联性。最后通过实验验证该算法对推荐结果实时性的改进。(3)本文调研了Flume、Kafka、Storm三个分布式框架,并基于这三个分布式框架设计了一个实时推荐模型,并在模型中应用了混合多模型的协同过滤算法和基于用户行为权重的实时性改进算法。本文实现了该实时推荐模型,并研究模型在应用实践中的实时推荐效果,验证该模型可以为用户提供实时推荐。
其他文献
<正>双11的数据一再突破历史纪录,既是意料之中,也是意料之外。我们在关注"你们也太能买了!"的背后,其实更需要思考双11对传统零售业的渗透与浸润作用、电商繁荣与实体零售业
所谓&#39;弹钢琴方法&#39;,就是围绕中心问题进行统筹兼顾、系统安排、协调配套地解决问题。本文在分析河北沿海地区经济发展现状基础上,将&#39;弹钢琴方法&#39;运用到河北沿
奥运经济是指奥运会举办前后一定时期内,所发生的与奥运会举办有联系的,具有经济效果或经济价值的各类活动。$$     奥运经济是注意力经济,会由于注意力资源的相对集中而给
学位
本文在工学结合新型教学理念的引领下,以国家级精品课程《建筑外立面设计》为例,阐述在"人才培养模式改革——工学结合课程体系构建——工学结合课程开发与建设"框架下进行课
随着2008年金融危机的爆发,大多数国家的审计学者以及实务人士意识到传统审计报告是顺序结构,除审计意见外,基本上是千篇一律的套话,信息含量不足,相关性下降,不能作为展示审计人员独立审计工作的窗口,形成了一定的审计期望差距。因此,为了解决审计期望差距,国际审计与鉴证理事会于2015年发布了新修订的审计准则。我国财政部为了使得国内审计准则与国际趋同,于2016年底发布了12项新审计准则,其中最为关键的
<正>主持人王兵:听说几位老师为了今天这个相聚都做了很多准备工作,尤其是翻出了很多老照片,这些老照片的背后有很多故事是我们这些后辈不知道的,今天就有请这些老前辈们根据
调查发现初夏黄海中部和北部海洋鞭毛虫的丰度为45~1278个/cm3,平均为479个/cm3;从水平方向上看,黄海中部高于北部,鞭毛虫的丰度随离岸距离增加而递减,近岸水域的数量最高,与
机动能力是部队战斗力的基础因素.本文中首先讨论了机动性的定义和内涵,认为机动性是一种复合型的性能,其评估也是一个较为复杂的问题.然后研究分析了实车试验、模拟仿真、数学分
<正>车队是汽车专业运输单位安全管理工作的前沿,安全管理是车队管理的基础,车队的管理好与坏,事关安全行车的大事。江苏盐阜公路运输集团大丰有限公司是大丰市唯一的汽车客
为解决传统模式下电力系统倒闸操作存在效率低、人力成本高的缺点,设计一种以服务机器人为平台并具有远程移动监控功能的倒闸服务机器人系统。系统本地端以搭载Android系统的