基于淘宝商品行为的向量化内容召回方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:hongsx14
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着内容营销成为越来越重要的营销方式,淘宝App开始在其首页推荐栏下进行电商内容的推荐。电商内容推荐的初期会面临推荐系统常见的冷启动问题,而淘宝已经积累了多年的用户商品行为日志,通过利用用户在商品上的行为信息可以有效缓解内容推荐在起步阶段的冷启动问题。推荐系统最重要的两个阶段为召回和排序,召回阶段从海量的资源池中筛选出用户感兴趣的资源作为排序阶段的候选集合。召回阶段决定了排序阶段的准确率上限,且需要在毫秒级别的时间内完成。为此,本文针对淘宝在内容推荐初期的冷启动问题,在召回阶段的算法进行了以下研究工作:提出了一个将用户在商品上的行为编码为向量的用户模型,融合了用户在商品上的点击和搜索两种行为序列的文本信息,引入了用户行为序列中的时序和时间间隔信息,将用户的行为信息从商品空间映射到文本语义空间。通过淘宝全网搜索记录构建一个用户兴趣词表,基于该词表通过一个多标签兴趣分类任务对用户模型进行评估,通过抽取淘宝一亿用户半个月的行为日志作为实验数据,设计实验验证了用户模型的有效性。使用一个基于双向自注意力机制编码器的内容模型提取内容向量。采用淘宝中达人分享内容作为实验样本,并利用淘宝经验的搜索索引数据为每篇达人分享内容打上兴趣标签,通过实验确定了内容模型输入的文本序列长度,并与其他方法进行对比,验证了内容模型的编码效果。借鉴深度语义匹配模型的思想,提出了一个将用户在商品上的行为与内容进行匹配的模型。对于匹配模型训练时的数据稀疏和向量空间不一致问题,提出了一种共享逻辑层参数进行联合训练的预训练方法。通过分析随机采样、按点击热度采样和正样本分布的差异,选择适合的负样本构建策略。最后利用淘宝用户的行为日志构建实验样本,设计多组实验,验证了匹配模型可以有效解决推荐系统开展新业务时的冷启动问题。综上,本文提出的向量化召回模型,将用户行为信息从商品空间映射到文本语义空间,实现用户与电商内容的匹配,可以有效解决冷启动问题。
其他文献
仲裁在商事贸易中一直具有很重要的地位,首先它因为比较中立所以在国际贸易纠纷中相对公平性强,其次仲裁的裁决在国际上可执行性更强,再次仲裁机构在解决商事贸易纠纷中经验
全球关于清洁能源的需求和环境保护的意识不断增长,因而对于高效储能设备的需求也越来越大。超级电容器作为一种新型的能量存储设备,因其具有快速的充放电速率、较高的功率密
室内空气品质(IAQ)一直以来都和我们的生活息息相关,恶劣的室内空气品质不但会降低空气环境舒适性,而且也无法保障我们的身体健康。卫生间作为一类独特的室内空间,由于人员停
本文综述了荧光增白剂在造纸工业中的作用,介绍了适用于造纸工业的荧光增白剂应具有的基本要求和主要品种,在不同使用条件情况下应选择与之相匹配的荧光增白剂所考虑的因素.
大多的天然地表土都是K0固结土,这也是土力学研究领域中重要的课题。K0压缩是约束土体侧向不变形,是变形约束下的情况之一,变形约束通常用土的体积应变增量与轴向应变增量之
传统永磁电机具有结构简单、运行可靠且拥有高转矩、高效率的性能,但普遍存在磁场难调节的问题,因此,本文创新性的提出了一种磁极旋转式新型机械变磁通永磁同步电机(Novel Me
汽车天窗是一个较为复杂的汽车外饰系统,它由框架组,机械组、马达组、玻璃组和遮阳帘构成。如今,汽车天窗逐渐成为汽车的标准配置,汽车外饰的美观性以及功能性逐渐被人们重视
在图案设计中,通常需要调整元素的个数、位置、大小和方向,以及元素与元素之间的距离、角度等关系,从而将元素排列、组合成结构协调、美观的一个整体。手工图案设计是一件耗时费力的事情,而且要求设计者有较高的美学基础。因此,高效的图案辅助生成浏览是计算机图形学领域的一个重要研究问题。现有方法大多以给定的样本为基础,对样本进行适当变化,得到相应的结果。然而,它们大多只能在元素个数和拓扑结构相同的图案之间进行新
本文立足于对变换应力三维化方法、统一硬化(UH)模型及其有限元子程序的深入分析,研究UH模型在某些情况下有限元计算不易收敛的原因,找出了问题所在,并给出了解决方法。在此
近年来,受“荷叶效应”的启发,科研人员通过模仿荷叶表面的微纳二级结构,制备了各种具有优异性能的表面,而超疏水表面由于其浸润性,在防冻、自清洁和液滴操纵等领域得到广泛