【摘 要】
:
随着现代科技的飞速发展,互联网广告投放也在全球普及。点击率(Click-Through-Rate, CTR)预估是互联网广告投放的核心问题,通过使用机器学习方法,充分利用广告系统日志中的数
论文部分内容阅读
随着现代科技的飞速发展,互联网广告投放也在全球普及。点击率(Click-Through-Rate, CTR)预估是互联网广告投放的核心问题,通过使用机器学习方法,充分利用广告系统日志中的数据进行预测,计算出用户对候选广告点击概率的大小,从中选出被用户点击的概率较大的广告展示给用户。逻辑回归模型是常用的机器学习方法之一,但是逻辑回归是一个线性模型,不能学习到数据中的非线性特征信息,而且逻辑回归模型参数较多,容易造成过拟合的问题,这给广告点击率预估问题带来了困难。本文在充分调研点击率预估问题常用机器学习模型的前提下,将深层神经网络模型应用于广告点击率预告问题中,据我调研文献之后所知学术界当前的研究还没有涉及到这种方法。本文主要做了以下几个工作:(1)对实验数据进行了分析与处理,针对数值连续型特征进行离散化,针对类别型特征直接使用One-hot Encoding进行特征编码。(2)用Python编程实现逻辑回归模型的代码模块,并使用该模型进行广告点击率预估问题的实验,实验结果作为基准与深层神经网络模型的结果对比。(3)调研深层神经网络模型,用深层神经网络模型为广告点击率预估问题建模。针对神经网络模型进行特征设计,并分别选取了Sigmoid与Relu两种激活函数进行实验。本文实验基于开源机器学习平台Petuum中的深层神经网络模块,使用的数据来自于广告公司Cretio的实际数据。
其他文献
中国特色社会主义理论体系包括邓小平理论、“三个代表”重要思想和科学发展观在内的科学理论体系,是马克思主义中国化的最新研究成果,是中国共产党的集体智慧结晶,是对马克
韩国的电视产业距今已发展了近60年之久,如今已完全进入多媒体、多通道时代。电视剧、娱乐节目、歌曲等不仅在韩国国内站稳了脚跟,更被周边国家大规模引进效仿,吸引了大量人气。
班级管理工作是学校教育工作中不可缺少的至关重要的工作,是一项繁琐复杂而且周期长的系统工作,班主任是这项具体工作的领导者、组织者和实施者。对上要对学校、社会负责,对
农业产业化是解决我国“三农”问题的关键,具有广泛的适用性和旺盛的生命力。经过20多年的努力,广东省的农业产业化取得了一定的成绩,在提高农业产业化效率、增加农民收入、
中国古典诗词是中国文学艺术的瑰宝,蕴含着丰富的中国历史文化内涵。随着中外文化交流的深入,越来越多的学者和翻译爱好者热衷于古典诗词的翻译,也开始关注翻译中意象传达的
大学生创业不仅有利于大学生个人价值的实现,更有利于我国社会经济的发展和产业结构的转型。北京是全国高等院校的中心,聚集了全国乃至世界的著名高校,研究首都大学生创业意
<正>急速变迁和真相扭曲是我们这个时代的通病之一。面对新技术发展和社会结构变化带来的不适应感,人们渴望在纷纭复杂的社会表象中挖掘更深层次的事实与深意,也渴望在杂乱无
P2P网络融资模式作为新兴的一种民间融资渠道,越来越受到我国社会公众的关注,它为广大手持资金的投资需求者和急需资金的融资需求者提供了满足需求的可能性。众多国内外学者
混凝土结构由于施工不当和外力作用,及其建筑材料性质的影响,造成内部结构的介质隐患。混凝土结构中的介质隐患主要有蜂窝空洞、裂缝和局部不密实。由于这些缺陷,使混凝土结
班主任是班级的组织者、协调者、管理者和教育者,是距离学生最近、与学生接触最多、对学生影响最大的教师。本文采用文献资料、问卷调查和现场访谈为主要研究方法,以合肥六中等