大规模在线内容推荐系统关键算法的设计与实现

来源 :北京交通大学 | 被引量 : 10次 | 上传用户:wangluojishu0802
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术尤其是移动互联网技术的飞速发展,网络平台上的信息量呈现指数级增长;如何从海量数据中发现感兴趣的内容对用户来说是一大挑战。作为解决这种挑战的有效手段,推荐系统被越来越多地用于为用户提供个性化服务。本文的主要工作是为易车APP设计在线推荐系统,并优化其关键算法。面对易车APP的数百万用户和数十万内容资源,设计在线推荐系统有着三方面挑战:首先,推荐系统需满足实时性和准确性要求,以提高用户体验;其次,推荐系统需具备足够的灵活性,以方便内容推荐和推荐场景扩展;最后,推荐系统需具备足够的扩展性,以支持对推荐算法进行高效率更新。为了解决这些挑战,本文设计实现了由数据处理层、候选集召回层和排序层组成的在线推荐系统,并且从候选集触发策略和排序模型两方面对推荐算法进行优化更新。主要贡献如下:(1)在系统设计层面,采用分层设计方法,将在线推荐系统解耦为数据处理层、候选集召回层和排序层,提高了系统的可扩展性。其中,候选集召回层联合使用基于内容、标签、关联规则和热点的推荐算法解决不同方面的推荐问题,来提高推荐效果;排序层使用机器学习模型对候选集中的内容进行排序,来提高推荐的准确率。(2)在候选集生成层面,本文对基于内容和热点的推荐算法进行改进:1)提出基于内容时效性的推荐算法(CB_time_delay),将内容的时效性用于内容相似度计算。线上A/B测试表明,该算法使文章视频点击率比原有的基于内容推荐的算法提高了 30%。2)提出一种衡量内容热度的测度指标,实现了基于该测度指标的热点排序算法。在线A/B测试结果显示,改进之后,文章视频的点击率比原来基于热点的推荐算法提高了 9.5%。(3)在内容排序层面,通过离线比较逻辑回归(LR)、梯度提升树(GBDT)和Wide&Deep三种机器学习算法的AUC(Area Under Curve)性能指标值和计算复杂度,使用L1正则化的逻辑回归模型的AUC值高于GBDT和Wide&Deep模型,计算复杂度也低于另外两个模型;最后本文选取了施加L1正则化的逻辑回归模型作为线上的排序模型。论文设计的系统已经实际部署,应用于易车APP的大规模内容推荐,新版本的推荐系统有更好的推荐效果,人均阅读上升为原来的1.7倍,文章视频的点击率提高为原来的两倍。
其他文献
高速公路加油站具有车流量大、加油量大、资金流动大等特点,经营风险大于其他一些加油站,其主要表现形式有跑单(加油不付款)、加油枪脱落、撞坏加油机、撞车和遭到抢劫等。针对这
AMODELFORWHITENOISEANALYSISINP-ADICNUMBERFIELDS(黄志远)¥AndrewKhrennikov(MoscowInst.ofElectronicEngineering,103498,Zelenograd,K-...
在节能减排日益重要的今天,多联式空调凭借其高能效、安装简单、控制自由等特点,广泛适用于写字楼、政府机关、医疗机构及大型商业空间等场所,已然成为行业的重要组成部分。
The problem of determining the pass on heat coefficient of the water-bearing stratum in geothermal reservior exploitation is investigated using the regularised
中国古代音乐史建立在音乐和历史这两大学科之上,属于音乐和历史的交叉学科。了解我国历史学领域的学术思想,借鉴其研究方法和研究理论对我们而言是很有必要的。20世纪二三十
§ 1. Introduction Let Ω be a smooth bounded domain in R~n with n≥2. We are concerned with the eigenvalue problem where v is the unit outward normal to Ω
刚才,天普同志代表党组就安全环保工作作了报告,我完全赞同。集团公司工作会议刚刚结束,党组研究决定在春节前召开安全环保工作会议,尽早地把全年的安全环保工作部署好。希望大家
Let Ω be a bounded domain in R~n with smooth boundary (?)Ω. In this paper we shall study the Dirichlet problem for the following quasilinear elliptic system:
从地级分公司的角度对石化加油卡工程中先后实施的加油站卡机联动方案和POS机方案进行了较全面的比较,比较结果认为POS机方案具有投资少,维护方便,可打印交易小票等优点,而卡机联
<正>随着新一年的到来,全球主要商用飞机制造商也开始进入新一轮的竞争,首飞新机型、启动新项目计划、重新制定竞争策略、调整生产率……2018年,无论对老牌飞机制造商还是新