基于多域嵌入的梯度提升决策树在广告CTR预估中的应用研究

来源 :兰州大学 | 被引量 : 1次 | 上传用户:polaris20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在广告推荐系统中,广告点击率(Click-through Rate,简称CTR)的预测十分重要,基于用户行为的特征交叉对于提高推荐系统点击率预测效果有着重要的作用。目前,大部分的端到端的神经网络模型都是通过嵌入层将高维稀疏特征转换为低维稠密特征,然后通过低维稠密特征的交叉来学习用户行为的交叉特征,但是这种端到端的模型缺乏可迁移性。因此,本文提出了多域嵌入模型(multi-fields embedding,简称MFE)。多域嵌入模型是一种预训练模型,它能够将不同域下的稀疏特征同时嵌入到同一向量空间,然后通过梯度提升决策树(Gradient Boosting Decision Trees,简称GBDT)模型来进行广告点击率的预测任务。通过和GBDT模型以及目前流行的端到端的神经网络模型FNN、NFM、Wide&Deep、Deep&Cross、DeepFM以及xDeepFM进行对比,在多个广告点击率的数据集上基于多域嵌入的梯度提升决策树模型取得了最好的效果。研究表明,多域嵌入模型能够很好的学习属于不同域的高维稀疏特征的表示,从而能够使模型在广告点击率任务上取得很好的效果。
其他文献
快速发展的电力电子技术和微处理器的应用使得交流调速系统具有更加优良的控制性能,永磁同步电机伺服系统也在朝着高控制精度和宽调速范围的方向发展。作为交流调速系统的核心部件,永磁同步电机的应用前景将更加广阔。在永磁同步电机的控制系统中,矢量控制系统的应用比较广泛,PMSM(Permanent Magnet Synchronous Motor)矢量控制系统中的控制器一般采用的是经典PI控制,凭借其结构简单
随着现代企业竞争的日益加剧,企业能否生存并得以发展,关键取决于客户资源的多少。客户多意味着企业能够获得更多的利润,唯有坚持深化与客户之间的合作,切实提高客户对企业的
在如今快速竞争的商业环境中,用户更倾向于使用最新的数据完成商业分析,因此实时ETL(Extract-Transform-Load)被提出以解决实时分析的需求。如今,实时ETL相关的研究层出不穷,
债券市场是我国资本市场的重要组成部分,债券市场的稳定很大程度上决定了我国资本市场的稳定,进而深刻影响着国家金融安全。经过30余年的发展,我国债券市场已成为全球第三大
进入二十一世纪后,计算机科学技术和信息通信技术的飞快发展使得互联网行业获得了迅猛和长足的进步。与此同时,各种实体行业开始与互联网紧密结合起来,互联网广告作为一种全
九零后出生在二十世纪末期,成长于二十一世纪初期,正处于我国经济社会发生巨大变化的重要时期。这一时期,人们的思想观念、行为方式等都在发生比较大的变化。随着九零后逐渐走上社会舞台,结婚生子已经成为每一个年轻人都需要考虑的重要问题。尤其是对于女性来说,一方面受到来自父辈甚至祖辈传统观念的影响,另一方面成长于新时代的九零后又可以受到网络、书本或者其他途径更加新潮和科学的思想观念的影响,会对一些传统观念有抵
图像语义分割是计算机视觉领域中十分重要但是又存在诸多难点的技术,用途十分广泛,其中用于自动驾驶的实时语义分割也是未来的发展重点之一,随着周围生活环境的日益复杂,准确并且高效的语义分割算法拥有较高实际应用价值,随着技术的不断进步,数据指数式的递增,研究语义分割同样具有较强的研究意义,而目前针对语义分割的研究思路大致分为两步:第一步则是通过卷积神经网络不断提取特征,实现对于目标的大量语义信息的采集;第
识别土地利用强度影响因素对调整和优化土地利用结构,缓解人地矛盾,促进区域经济可持续发展具有重要意义。本文以疏勒河流域中下游为研究对象,在1987-2015年疏勒河流域中下游
声参量阵是一种新型的扬声器,能够把音频信号向指定方向发射,是近年来的研究热点,在广播、通信等领域具有广阔应用前景。声参量阵通过幅度调制方法将音频信号调制到超声载波上,然后通过空气的非线性作用,音频信号会沿着信号传播方向进行自解调,进而形成高指向性的声波束。本论文研究了声学参量阵的基础理论,对Westervelt方向、Berktay远场解以及KZK方程进行了简要说明。为优化声学参量阵的合成波束,本论
政治社会化是国家维护政治稳定的必要方式,通过政治社会化使各国公民对本国政治及政治系统形成基本政治认知、积极政治情感、强烈政治参与动机和兴趣、坚定不移政治信仰,有序