基于深度学习的CTR预测研究

来源 :重庆工商大学 | 被引量 : 8次 | 上传用户:learner1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网、云计算、物联网等技术的迅猛发展,网络的数据规模也在急剧增长,信息社会已经慢慢步入“大数据”时代。网络广告投放系统架构于大数据的基础上,系统利用机器学习对海量用户行为进行分析挖掘并向用户实时地推送合适的广告。点击率(Click Through Rate,CTR)预测是网络广告投放系统的核心技术,对于提升系统的运作效率意义重大。CTR的精准预测是制定科学的电子商务市场营销决策的关键,直接影响用户的网络体验,直接关系到互联网公司的运营成本。因此,CTR的预测具有很高的商业价值和研究价值。面对网络广告投放系统的高精准度和高时效的要求,本文从浅层学习和深度学习两个角度开展特征选择、特征学习、分类预测和应用技术研究。以网络广告真实的数据集为实验对象,分别构建浅层学习模型和深度学习模型。为了全面验证深度学习模型,本次研究通过多视角的综合对比实验来证实深度学习的巨大潜力。综合考虑,具体的研究工作主要包括以下五个方面:(1)开展数据处理和特征工程技术研究。从真实数据集出发探索研究类别不平衡性对预测模型的影响机理,不平衡数据的重采样技术。(2)针对数据特征的高度非线性特点,开展浅层学习和深度学习理论及应用技术对比研究。为了克服浅层模型对复杂问题学习能力受限问题,构建深度学习模型,实验通过算法实现证实了相对比浅层学习,深度学习的预测效果提升了约21%,具有很强的优势。(3)为消除类别不平衡对预测模型的影响,提出了一种深度神经网络(Deep Neural Network,DNN)的改进模型——SDNN(Deep Neural Network based on Sampling,SDNN)。基于GPU的并行计算,通过构建模型和实现算法验证了在不影响预测效果的同时,SDNN预测模型训练时间缩短了约73.28%,大幅度的提升了DNN的运算效率。针对系统的精准度和时效性的高要求,SDNN被证实是一种面向大数据更为高效的预测方法。(4)研究Sigmoid激活函数和Relu激活函数对DNN预测模型的影响机理。通过分别构建DNN和SDNN模型和算法的实现,证实了相对比Sigmoid激活函数,Relu激活函数更适合于层次较深的网络模型,基于Relu激活函数的DNN和SDNN更适合复杂问题的建模。(5)为了避免单一SDNN训练的局限性提升模型的泛化能力,开展关键参数dropout敏感性分析研究。
其他文献
@研究报告@ 应用聚合模型选育杂交水稻通用恢复系……………………··,………………….,…………………………………………… 廖昌礼 黄宗洪 倪克鱼 刘远坤 向关能4(且):1
继2016年12月25日爱立信携手中国电信上海公司打通Vo LTE首次通话之后,2017年初,爱立信携手中国电信江西公司、福建公司和浙江公司分别在3个省份打通了Vo LTE首次通话。至此,
杂交小麦的利用和研究对于大幅度提高小麦单位面积产量有重大意义。从六十年代初期育成第一个“比松”不育系和随后育成“马奎斯”恢复系的二十年中,国内外对Tr·timop heer
黑龙江省597农场4分场位于三江平原的三角地带,属于大陆性气候.自1987年开始种植甜菜,每年种植面积在5000亩以上,3年平均亩产2吨以上,经济效益显著,甜菜生产已成为我场的主
2017年1月,一则"辽宁省政府公开承认GDP造假"的新闻在社会上引起了巨大反响。关于经济数据的真实性再次引发了社会公众的质疑。"克强指数"的诞生则是为了消除人们对于政府公
报纸上有不少新闻,常用套话来代替事实。请看: “受到广大群众的热情赞扬”; “出现了令人喜悦的新局面”; “深受群众欢迎”; 如此等等。这些新闻都是表扬好人好事,想鼓舞
一个人担任了厂长或其他什么职务,做出了显著成绩,扭转了企业的落后局面,作为人才进行宣传十分必要。然而,宣传要适度,遣词用语也有个讲科学的问题。对这些同志的宣传报道,
在农民收入水平和消费水平逐渐提高,农村住房结构大规模变迁和城乡迁移三者交汇的大背景下,如何规范农户住房投资行为,不仅影响到我国新农村建设的成效,而且对农村耕地的保护和国
近几年,我国的旅游业得到了迅猛的发展。在世界各国快速发展旅游业的大背景下,我国的旅游产业随着改革开放的不断深入和社会经济的繁荣,旅游业已经处在非常激烈的竞争状态之中,并
指出:体育报必须认真贯彻执行“体育为无产阶级政治服务”的方针;坚持政治挂帅,增强党性。体委党组并体育报社:最近第五六○期体育报,介绍了南京体院体操班的思想教育工作,