基于多任务学习的短视频中用户行为预测研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:yukon_hawk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,短视频成为了互联网内容传播最主流的方式之一,随着其市场的逐渐成熟及竞争格局的逐渐稳定,用户的增长速度变得缓慢,用户的红利期也渐渐消退,短视频市场的竞争焦点也逐渐由增量市场转向存量市场。如何提高现有用户的活跃度、深入挖掘每个用户的价值是当前各个短视频平台十分重视的方向。因此,围绕多任务学习模型提升短视频中用户行为预测性能对各短视频平台探索更多元化和更深层次的商业变现模式具有重要意义。本文基于多任务学习模型对提升短视频中用户行为预测性能进行了研究,所做的工作包括以下几个方面:首先,本文提出了基于梯度加权的自适应优化算法GWDC(Adam with weighted gradient and dynamic bound of learning rate)和AMSGWDC(AMSGrad with weighted gradient and dynamic bound of learning rate),并给出了收敛性证明。通过在梯度的一阶矩估计中引入动态衰减率,使得在梯度的一阶矩估计中,将更多的记忆集中在最近的梯度上,从而有效的动态约束梯度的一阶矩估计中各个分量的占比。为了验证所提算法的有效性,本文选取了三个经典的公开数据集,将其应用到五种不同复杂度的网络结构中进行了实验,实验结果表明本文所提的两个基于梯度加权的自适应优化算法不仅具有更好的泛化性能而且具有更快的收敛速度。其次,本文还提出了一种基于注意力机制的特征表达方法。该方法通过对输入特征进行维度层面的变换从而训练一组权重,将该组权重与特征原始的表达做点积,得到特征的新的表达。为了验证所提方法的有效性,本文基于某短视频平台提供的数据进行了实验,建立了两个二分类模型,一个是预测用户是否观看完某视频,另一个是预测用户是否对某视频点赞。实验结果表明,本文提出的方法在这两个预测任务中均有助于评估指标的提升。最后,为了提升多任务模型 MMoE(Multi-gate Mixture-of-Experts)在短视频中对用户的行为预测性能,本文重新设计了 MMoE模型的网络结构,将基于注意力机制的特征表达方法封装为一个子层,作为MMoE模型的一个模块。并以本文提出的基于梯度加权的自适应优化算法GWDC作为优化器,通过在某短视频数据集上构建多任务学习模型,来研究短视频中用户的行为。实验结果表明,本文提出的方法可以提升MMoE模型在短视频中对用户的行为预测性能,从而提升短视频平台的用户粘性,为短视频平台挖掘用户价值、探索深层次的商业变现模式提供强有力的支撑。
其他文献
为满足当今用户对无线通信服务不断增长的需求,提升通信系统的性能成为新一代无线通信系统的目标。在不同的应用场景中,无线信道的复杂性和多样性给信号的的检测、估计带来了巨大挑战,我们需要更高性能的接收机以抑制复杂干扰的影响。其中,通过构建精确的估计器,提高有噪声信号的参数估计精确度是解决以上问题的核心方法之一。Cramér-Rao下限作为估计器的性能标准,辅助了的参数估计方法优化与设计,对于无线通信系统
近些年来,随着互联网用户对通信安全的要求愈加严苛,匿名通信工具的应用也日益广泛,在保护用户通信身份的同时,其自身安全性和传输效率也成为衡量匿名工具的重要指标。本文选用匿名通信系统Tor作为研究目标,其传输过程对用户透明,用户无法了解传输链路的节点效率及安全性,低带宽、不稳定节点的存在使Tor网络的性能及安全性受到影响。目前市面并无成熟的针对Tor节点信息进行采集并展示的平台,因此,本文围绕Tor节
D2D(Device-to-Device)通信作为第五代移动通信网络的主要技术之一,通过允许D2D用户(D2DUsers,DUs)复用蜂窝用户(Cellular Users,CUs)的频谱资源,有效地缓解了当前频谱资源日益紧缺的问题。然而,DUs复用蜂窝频谱资源也会带来复杂的干扰问题。为了解决这一问题,本文使用随机几何建模D2D辅助蜂窝网络,对系统进行了全面的性能分析,并利用推导得出的结果对全网能
近年来,随着大数据概念的兴起和发展,越来越多的行业和领域开始将目光投向大数据的挖掘和使用,旨在利用大数据推动行业的进步。然而,大数据中可能包含个人的隐私信息,如果将其发布在云端并进行共享,可能会造成个人隐私的泄露,损害个人利益,甚至威肋生命安全。大数据共享阶段一般对存储在云端的数据采用访问控制技术来控制数据的共享过程,其中密文策略的属性基加密(CP-ABE)技术能够提供细粒度的访问控制,因此受到广
探究神经元如何处理它们接收到的输入信息,从而产生能够激活其突触后神经元的动作电位对于理解大脑的工作方式至关重要。本论文主要研究了影响树突信号衰减的机制,研究结果使我们可以更加深入理解突触输入位置、树突放电(dendritic spikes)、树突直径等因素在神经元树突信号处理中扮演的角色。这些结果也能为探索树突整合突触输入的方式提供帮助,继而促进神经活动与行为间的联系方面的研究。具体而言,通过构建
随着国家、社会经济的发展,各行各业对安全的需求日益旺盛。水利、电力、油气、矿产、通信、网络、金融、国防等基础设施的稳定运行需要可靠的安防体系来保障。光纤制作原料充足,且具有质轻耐腐等稳定优良的物理化学性质,基于光纤传感原理的光纤安防系统受到了市场与研究人员的关注。为提高系统对入侵行为的分类正确率,结合机器学习算法对不同事件类型分类识别成为主流研究方向,且取得了不错的分类效果。然而目前多数算法识别分
近年来,在国家不断出台的利好政策支持下,我国工业互联网快速发展,而移动端工业APP作为工业互联网的核心价值体现,在搭载了移动互联网小巧轻便、易于获取和传播的优势的同时,也是对工业知识和经验的积累和沉淀,其“赋能”、“赋值”和“赋智”的作用日益凸显,拥有广阔的市场前景,具有很高的研究价值。然而,工业互联网发展提速带来了信息技术人才出现较大缺口的问题。为支持在新工科教育背景下,我国工业APP的持久向前
基于光子晶体微腔的传感器由于模式体积小、控光能力强、易于集成和无标记检测等优点被广泛应用到传感领域。近年来,具有高集成度和多参量传感能力的多参量传感器成为传感技术的研究趋势,基于光子晶体微腔的双参量传感器不断被提出。在此基础上,如何提高双参量传感器的检测准确性是一个需要重点关注的问题。通过对双参传感理论的分析,利用电场分布的不同增大灵敏度差异,可以有效提高双参量检测的准确性。传统的基于光子晶体微腔
随着智慧城市、虚拟现实与增强现实等新兴科技的发展,人们对数据流量的需求与日俱增。C-RAN架构无线前传CPRI接口速率过高限制了 B5G/6G系统的发展,模拟光载无线(RoF)技术相比数字化传输技术而言,无需采样和量化,可以有效解决前传接口带宽过高问题。传统RoF阵列系统架构成本高,容量低,不足以满足超大规模无线通信系统对超大带宽、超高容量的需求。针对上述挑战,论文研究了基于多芯光纤(MCF)传输
随着现代社会的数字化变革和互联网的飞速发展,大数据和云计算等新兴技术在推动数据中心规模化建设的同时,也产生了爆炸式增长的数据流量,对数据中心内部互连网络的带宽提供能力与能耗带来了前所未有的挑战。为了减少数据中心的搭建成本及能耗,提高数据中心内部数据传输的效率,本论文针对在数据中心内部互连网络中引入光交换的研究思路展开探索。首先结合数据中心内部业务传输需求与光交换技术的研究现状,提出了基于光时隙交换