广告点击率预测相关模型的比较研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:dianshenshizhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展和移动设备的普及,传统广告不再适应时代发展。线上广告变得越来越多,计算广告学随之兴起,点击率预测是计算广告学重点研究的一个方向。点击率预测带来的可观收益,不仅为广告平台和广告商带来巨大的好处,对绝大部分的用户也带来了良好的体验,所以点击率的预测是非常重要的。本文就是通过机器学习模型对广告点击率进行预测。本文主要是对Avazu数据集的分析。该数据集的训练集中包含10天的广告点击数据,共4千多万条记录,除去id列共有23个特征。选择其中100万条数据进行分析,离散特征进行one-hot编码,连续型进行归一化。首先在数据分析部分研究了点击量与时间和广告位置的关系:点击量的高峰大约是在每天下午的13点到14点之间,点击量的最低点是在每天的零点左右;位置0和位置1的数据比例较高,展现量和点击量都是最高的,但是他们的点击率并非最高。通过对每个特征的分析发现如下规律:展现量和点击量成正比,但高的展现量和点击量不一定有高的点击率。数据集正负比例2:8,属于不平衡的数据,对于这个问题常常采用欠抽样或者过抽样,本文使用class_weight参数改变类别的占比,使得结果不会偏向一边。然后,通过单模型逻辑回归、决策树和集成模型随机森林和GBDT对点击率进行预测,单模型中决策树的预测效果较好,集成模型中随机森林的预测效果较好,四个模型中随机森林的预测效果最好。由于GBDT不适合高维稀疏特征的数据,所以用它来预测的结果是最差的,常常将它和逻辑回归相融合来预测数据。
其他文献
2011版《义务教育英语课程标准》开门见山的强调义务教育阶段英语课程的主要目的是使学生掌握基本的英语语言知识,帮助学生形成基本的“听、说、读、写”技能,为进一步提升学生的语言运用能力打下坚实的基础。然而,由于传统应试思想的影响,目前初中英语教育严重缺乏对学生“听、说”能力的培养,传统“哑巴式”英语教学模式仍普遍存在,较大阻碍了学生英语综合素养的提升。然而如何使学生初步形成英语口语交流能力?如何提升
“手机不离手”已成为现代社会的普遍现象,有人“晒”心情,“晒”照片,有人点赞、评论,然而在娱乐的同时,其实也存在个人信息泄露的风险。个人信息的泄露对于个人的影响小到受到骚扰短信的烦恼,大到受到人身安全的威胁。个人信息安全状态的不稳定势必也会影响整个行业的发展,可以说,随着人们个人信息保护意识的觉醒,网络运营者对于个人信息的保护质量也是评判其能否持续稳健发展的重要一环。鉴于此,本文以手机APP为例来
词汇是语言的三大要素之一,学习好一门外语必须要有良好的词汇基础,英语词汇的记忆对学好英语起着十分重要的作用,尤其是在中学阶段。我国英语词汇教学主要面临着“去语境化”、“忽略词汇之间的联系与运用”和“忽视学生的学习主体地位”等问题,这导致学生的词汇学习刻板枯燥,费时低效。精细加工是一个有意识地将目标信息与已记忆信息联系起来的过程,通过精细加工联想出的特殊的线索信息能够增强记忆。对词汇进行精细加能够提
随着社会经济的不断发展和全球化进程的加剧,计量经济学体系在获得巨大发展机遇的同时,也面临着前所未有的挑战.一方面,由于数据的收集越来越容易,计量经济学体系可以应用的范围急剧扩张,越来越多的社会经济规律得以被揭示和研究;另一方面,随着数据量的不断增加和数据种类的不断丰富,传统的计量经济学模型体系在参数估计和模型拟合上所面临的困境也逐渐显现.如何扩大有关模型的适用范围,使其更好地发挥本身优势,是目前计
随着短视频行业兴起,竖屏格式节目开始出现,各大传统媒体与网络视频平台纷纷试水竖屏格式节目(后简称竖屏节目)。与传统的横屏节目相比,竖屏节目在节目制播各流程都逐渐形成了自己特有的竖屏传播体系,尽管这套竖屏体系目前尚未十分完善,但随着5G时代的到来,依托手机移动端的竖屏生态系统将会越来越完善。也正是由于竖屏短视频的快速兴起,催生出了很多竖屏一代的“网红”主播,近几年“去主持人化”热潮也跟随“网红”主播
劳动力保护措施在所有经济体中都广泛存在,人力资本作为企业的核心竞争力其重要性愈发上升,因此研究劳动力市场的政策变化如何影响企业是一个极其重要的问题。本论文从政策评估的视角来分析《劳动合同法》的出台实施对企业现金持有水平及经营风险产生的实际影响,同时提出劳动力调整成本传导机制进行理论分析,并通过实证分析证明了该传导机制的存在。本论文的理论研究发现劳动力保护措施增强会提高企业劳动力调整成本以及劳动密集
《普通高中语文课程标准(2017版)》提出了“注重信息化背景下教与学方式的探索,为实现教育现代化而努力”的目标,《教育信息化2.0行动计划》中也明确要求“开展智慧教育探索与实践,推动教育理念与模式、教学内容与方法的改革创新”。然而,当前语文课程的智慧教学研究和实践与其它一些学科相比却相对较为滞后,原因一方面是语文课程的教学思维和教学模式相对较为固化,与信息技术的整合不够紧密;另一方面是语文教师由于
我国私募股权投资开始于1985年,随着资本市场的发展,市场审批机制日益规范,金融机构放贷日益严格。在这种环境下私募股权投资基金可以作为企业筹资的来源,从而在一定程度上缓解了中小企业发展过程中资金不足的问题,成为越来越重要的金融市场组成部分。然而,随着2017年首届“大发审委”组建,IPO审核效率不断提高,且审核趋严,导致企业上市困难重重,私募股权投资基金退出困难。这就要求私募股权投资机构投资项目时
作为一种重要的结构骨架,二氢吲哚环存在于许多天然产物、药物分子和合成中间体中。因此,二氢吲哚结构的构建吸引了几代化学家的关注,许多非金属和金属催化构建二氢吲哚类化合物的方法已经被广泛报道,钯作为催化反应中最常用的过渡金属之一,也被用来催化构筑二氢吲哚结构化合物。例如钯催化的烷基链或者芳香环C-H活化、Wacker氧化、烯丙基取代都能有效地合成二氢吲哚类化合物。通过钯催化的烯丙基C-H活化方法构建二
当代具象绘画风格迥异,题材涉及广泛,创作方法也没有明确的规定。但作为绘画的种类之一,创作者和观者是通过眼睛来知觉具象绘画的,所以视知觉在感知具象绘画作品时的一系活动特征对创作来说是具有极大参考价值的。视知觉是具有与思维类似的功能的知觉过程。视知觉能够主动把握客观对象,且具有一定规律,其选择性与整体性的理性特征能够让知觉主动把握客观对象的本质特征。在具象绘画中,需要为视知觉提供一个具有事物本质特征的