基于内容广告平台的点击率预估系统的设计与实现

被引量 : 0次 | 上传用户:HGameG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
内容广告是互联网广告的一种,基于分析页面内容和用户信息将高相关性广告展现在网页上。内容广告系统与传统互联网广告系统有着很大的不同,内容广告系统主要将小广告主的广告展现在长尾流量上,因此,内容广告系统的广告库更大,流量也更多。在内容广告系统中,每次广告检索都是从百万级的广告库中挑选与页面、用户信息最相关的部分广告,由于性能原因,无法运用复杂的技术逐一计算每条广告的相关性,所以,内容广告系统按照相关性计算的复杂度将检索过程分成两个部分:广告粗选和广告排序。广告粗选阶段采用计算量较小的技术挑选部分广告,然后在广告排序阶段运用复杂的分析技术对这部分广告进行排序。本文主要关注广告排序阶段,即点击率预估。传统计算相关性的方法是提取广告和页面的关键词向量,计算两个向量的相似度,这种方法最大的缺点是忽略了广告展示和点击的历史日志。本文介绍的点击率预估系统通过提取广告、用户和页面信息的特征,运用逻辑回归模型预估广告点击率,并基于此对广告进行排序,逻辑回归模型从线下广告历史日志中训练得出。相对于传统方法,点击率预估技术利用的信息更加全面,从历史日志中挖掘信息训练模型也使得相关性计算更加准确。本文主要介绍了点击率预估系统的设计与实现。首先介绍了国内外计算广告相关性的各种方法,引出了点击率预估,然后介绍了点击率预估的算法原理和在实现点击率预估系统的过程中使用的主要技术。在后续章节中,通过对内容广告系统的整体架构以及设计思想的分析,引出了点击率预估的需求包括功能、性能和内外部接口。围绕着需求展开了对点击率预估系统的设计与实现的介绍,并着重在性能和算法实验的便捷性两个方面做了重点的分析优化。最后详细分析了点击率预估系统对整个内容广告系统带来的效果提升。论文的最后,通过总结与展望,对技术的改进方向以及应用前景做了进一步的分析。
其他文献
以三江平原为研究区,利用多时相的中分辨率成像光谱仪(Moderate Resolution Imaging Spectroradiometer,MODIS)影像数据,采用一种基于归一化植被指数(Normalized Difference
防范要点一些病急乱投医的老年患者,很容易陷进骗子精心布置的“祖传秘方”圈套。在选择治疗方法时,一定要通过正规医院进行针对性治疗,切不可随意一味迷信“偏方”“特效药
一、研究背景发展社区卫生服务的重要性在于它是构筑公共卫生体系和医疗服务体系的网底,是实现人人享有初级卫生保健目标的基础环节,也是政府履行社会管理和公共服务职能的一
20世纪90年代以来,随着全球化的不断深入和信息技术的快速发展,服务外包成为推动新一轮产业转移的主要力量。服务外包具有信息技术含量高、附加值大、环境污染少、就业吸纳能力
先秦儒家的基本义理架构是“本体——工夫——发用”三者相即一如之格局,即孔子的“一贯之道”。道体生生,直贯于人则为性体(有自然属性与道德属性之分),个体之人则或由他缘(
以提高机组运行的经济性为目的,通过运行操作上的调整试验,改变循环水系统的运行方式,提高机组运行效率,降低循环水泵厂用电率,达到运行效益的最大化,为运行日常操作提供指导
气相掺杂法因其简易灵活、生产周期短、成本较低的优点成为生产区熔硅单晶重要的辅助方法。本文根据区熔(FZ)硅单晶气相掺杂原理,结合单晶生长速度、单晶直径、气体流量、气体浓
本文从语言的角度,运用批判话语分析的方法剖析了奥巴马当选美国总统这一重要事件。选举过程中话语是最主要和重要的实践活动,所以当选总统不仅是政治事件,更是话语事件。分
目的:探讨有效提升我国青年高层次人才队伍质量的途径。方法:根据千人计划官网历批次公布的公示名单和公布名单作为数据基础进行资料收集,使用Excel、SPSS 19.0软件对"青年千
在国内外网络结构和企业核心能力文献回顾基础上,将知识共享、知识整合作为中介变量引入到网络结构与企业核心能力关联关系中,构建网络结构、知识共享与知识整合、企业核心能