基于多组特征与模型融合的广告点击率预测

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:xiaoshuishe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线广告不断的发展,计算广告成为了一门新兴的重要学科。在计算广告的投放系统中,广告点击率预测算法是重要的一环,提升广告点击预测准确率对提升广告投放系统收益有至关重要的作用。广告点击率预测问题中的难点在于其特征多为离散特征并且特征稀疏性高。传统的机器学习分类算法比如逻辑回归在解决这列问题时需要大量的特征工程,因子分解机模型可以学习二阶交叉特征,深度学习擅长隐含地学习交叉特征。有一些深度学习和因子分解机融合的模型取得了很好的效果,把不同深度模型集成起来可以有效地提升广告点击率预测的效果。本文研究基于多组特征的深度学习算法,设计一种改进的混合专家模型进行集成学习并且在真实数据集上验证效果,最后设计广告点击率预测系统,对系统性能进行优化。本文研究主要贡献如下:(1)对广告点击率数据集进行研究,构造多组特征工程。研究发现多组特征在DeepFM、xDeepFM两个深度学习模型上表现较好,这是进行集成学习的理论基础。对单模型的研究发现,深度学习与因子分解机模型联合训练的模型表现较好,为后续混合模型的研究提供理论基础。(2)为了能够深入挖掘多组特征的信息,对多个模型加以综合应用。本文研究相关的集成学习方法,设计出改进的混合专家模型进行集成学习。根据多组特征的实验结果,用控制变量实验法确定其结构。最终实验结果表明,混合专家模型在不大规模增加训练时间的情况下,AUC指标相对单模型提升1.5%。(3)本文搭建广告点击率预测系统并对其在线预测性能进行调优,引入冷启动机制增加系统鲁棒性。针对Python语言运行速度相对较慢的问题,采用Libtorch框架和离线特征用C++搭建预测模块,将在线预测速率提升了 3.5倍。
其他文献
某石灰石筒仓内壁出现了程度不同的劣化现象,大面积混凝土脱落、环向受力钢筋外露甚至磨断,对结构安全及生产安全带来隐患。为保证筒仓能够正常使用,依据现场检测鉴定结果,分
防空反导是一项直接关系到国防安全的重要军事任务。随着信息化战争的发展,对防空反导系统电磁态势分析能力的要求也日益提高。然而,防空反导战场电磁环境不仅复杂程度高、变化速度快,而且攻防对抗激烈,这大大增加了全面分析电磁态势的难度。因此,对面向防空反导战场的电磁态势分析方法的研究意义重大。本文以网络化防空反导系统为例,详细探讨了战场电磁态势分析流程,并有针对性地研究了其中的电磁态势描述和评估方法,主要工
美育教育是素质教育的重要内容,而小学美术教育则是美育教育当中的一部分,在完善学生审美能力和培养学生艺术素质方面发挥着不可替代的作用。教师在小学美术教育指导当中,不
半导体光放大器(SOA)作为全光集成器件的核心,在全光通信和光纤传感等领域中具有重要的应用前景。值得关注的是,半导体光放大器的材料增益透明决定了它的快慢光过渡点和信号
随着海洋观测技术的不断发展,人类获取的海洋数据也快速增长,由于海洋流场是整个海洋系统物质流和能量流输送的主要渠道,基于这些观测数据进行海洋流场迁移变化规律分析及可
随着网络教育规模日益扩大,教学质量受到社会关注。网络课程的教学督导是网络教学质量保证的重要组成部分,构建网络课程的教学督导指标体系更是研究和实践的重点。聚焦网络课
目的:分析肺腺癌的高分辨率CT(high resolution CT,HRCT)征象与病理亚型、程序性死亡因子配体1(programmed death ligand 1,PD-L1)表达的关系。方法:肺腺癌147例,分为浸润前
随着氮化镓(GaN)基功率器件功率越来越高,器件的“自热效应”愈加明显,对高频高功率电子器件散热提出了迫切需求。采用CVD金刚石代替传统衬底材料可以有效满足高频高功率器件
为研究绿茶栗香形成的干燥工艺及机理,笔者综述了近30年来国内外的香气及栗香相关研究,发现香气的研究较多而栗香的研究却少有提及。栗香香型虽已做出细分并探究出其关键组分
教育部考试中心任子朝先生在《新高考数学学科考核目标与考查要求研究》中提出"高考数学学科在考查过程中要体现基础性、综合性、应用性和创新性的考查要求".2019年高考全国