展示广告点击率预估方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bohaiyifan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,在线广告系统在我们日常生活中扮演着越来越重要的角色,并且成为了广告主进行品牌推广和产品营销最有效的方法,准确的预测点击率是在线广告系统最重要的一个环节,因为提高广告点击率预估的准确率不仅有益于广告商的品牌推广,还可以提高用户体验。很多传统点击率预估方法如逻辑回归已经被应用在广告点击率预估系统上并取得了很好的效果,而且在工业界也已经大规模部署。近年来深度学习技术在自然语言处理和计算机视觉任务上取得了不错的成绩,如文本蕴含、文本摘要和图像生成等领域。随之一些深度学习模型也被应用在个性化推荐系统和点击率预估系统上,而且模型结构颇为相似,都是先对特征向量进行降维,然后再使用非线性操作提取特征组合,最后通过深度神经网络继续寻找特征与点击率之间的非线性关系。本文的主要研究内容从以下三个方向进行:(1)基于传统机器学习方法的多模型融合点击率预估任务研究。本文首先在两个大规模真实广告点击率数据集上进行特征工程工作,并使用GBDT算法提取高阶特征组合,然后使用成熟的传统机器学习模型如LR模型和FM模型进行单模型点击率预测,并在单模型的基础上进行模型融合,得到模型融合方法的点击率预估结果。(2)基于传统深度学习方法的点击率预估任务研究。本文使用简单的深度神经网络和循环神经网络作为点击率预估的模型,并尝试结合了之前人工特征工程提取的特征,通过特征哈希与特征拼接等手段得到深度神经网络的输入,计算了传统深度学习模型方法的点击率预估结果。(3)基于Multi-Embedding层的深度学习点击率预估模型研究。文本提出了一种新型的深度学习点击率预估模型模板,其中包含基于传统Multi-Embedding的深度神经网络模型和卷积神经网络模型,以及基于双线性Multi-Embedding的深度神经网络模型和卷积神经网络模型。其中双线性过程主要用于特征提取与高阶特征组合,替代了使用FM等二阶特征组合方法。本文还设计了一种结合了聚类和稀疏位标记方法的模型用于解决冷启动问题。并在IPin You和Avazu两个大规模真实数据集上进行实验,实验结果表明,基于Multi-Embedding的点击率预估模型在结果上要优于目前主流的深度CTR模型。
其他文献
农业是受气象灾害影响最敏感的行业,农村是气象灾害防御最薄弱的领域,农民是气象防灾减灾最应关注的弱势群体。文章概括总结了"三农"气象服务的成果,分析当前气象服务存在的
本文将山水画的产生看作一个形成过程,这个过程从山水题材在绘画中的分离开始,代表者是顾恺之。又经历了宗炳、王微的初创,到隋唐进入独立发展时期。文章对这一过程进行了史与论
当今,随着国家逐步推行科技强国和人才强国战略,加大资金和人力投入到高等教育的工作上来,促进了我国高等教育的繁荣稳定。在推行高等教育的过程中,加大对高等职业教育成为实
以浙江省科技进步统计监测数据为基础,以SWOT分析方法为工具,通过对温州市科技进步状况与浙江省相关城市的比较,指出温州科技进步水平落后于经济发展水平,并已对经济社会发展形成
<正>笔者前不久到南方考察时了解到:浙江海宁市袁花镇龙联村在有限的土地上发展生态种养,显示出巨大的发展潜力,许多村民依靠生态种养巧致富。他们主要采用以下方法。
期刊
近年来,高等职业教育在高速发展的同时也出现了一些问题,除了高职院校自身的努力调整外,政府也需要及时进行角色转变。文章从当前高等职业教育发展过程中的政府定位入手,理清
<正>"券商+互联网"和"互联网+券商"两股潮流平行发展,催生出我国新型的"互联网券商"生态体系。据业内分析,当前互联网券商创新模式日趋多元,传统券商互联网化转型之路并不顺
中医药治疗儿童多动症的研究进展及思路中国中医研究院广安门医院(100053)韩斐,苗雨青儿童多动症的发病原因尚不十分清楚,目前主要从遗传、脑部器质性病变、脑内神经递质代谢的异常,心理
国家电网公司2005年组织编写并出版了各电压等级变电所典型设计方案。变电所典型设计方案的套用应根据工程实际,分析各项套用前提条件,归纳出项目工程规模及工程设想,选择适
社会的进步需要一流的物业服务企业,而一流的物业服务企业需要由优秀的员工组成。员工的本体素质、专业技能、服务意识直接决定着物业服务企业的服务质量以及生存、发展状况,