基于大数据分析的广告点击率预估方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:woai2010ni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球网络广告产业的高速发展,计算广告应运而生。作为一种将技术和计算与网络广告投放决策进行结合的广告投放模式,它基于给定的广告投放请求,考虑广告投放的上下文环境和用户特点,从候选广告库中通过计算选择与之最匹配的广告,然后将广告投放至目标受众。在计算广告领域中,广告点击率预估(Ad Click-Through Rate Prediction)是与整个网络广告产业链息息相关的核心技术。本文基于实际工业界广告点击日志对广告点击率预估方法进行研究。利用大数据分析技术对日志进行预处理、特征提取以及模型构建,系统地探讨了数据的预处理方法、特征挖掘与表达以及广告点击率预估算法。论文完成的主要工作包括:(1)针对日志的预处理问题,本文提出了基于幂律分布的异常用户检测方法。该方法考虑数据中所有用户的点击量分布情况,从数据集自身统计分析的角度判断异常用户,具有较好的物理意义和可解释性。本文通过实验设计与分析验证了该方法的有效性。(2)针对特征提取问题,本文先从用户、广告和上下文三个方面去提取类别特征,然后设计了一种统计特征构建框架,并测试了统计特征在多种模型下的效果,验证了统计特征构建框架的有效性。(3)为了有效利用构建出的特征,本文提出了融合特征选择的广告点击率预估混合模型。实验结果表明,该模型有效提高了预估的准确性。在以上研究的基础上,本文设计并实现了一个面向广告点击率预估的大数据分析平台,将大数据分布式处理框架部署在计算机集群上,并且提供特征构建和广告点击率预估的前端展示界面。
其他文献
动画作为一种综合艺术门类以其独到的表现方式在影像市场上发挥着重要作用。由我国乐府民歌《木兰辞》改编的迪士尼动画电影《花木兰》,一经上线便获得了巨大成功,作为好莱坞
步入21世纪以来,小学数学需要改变固有的教学方式,创新教学策略,激发小学生的数学兴趣,构建和谐的师生关系,营造愉悦的课堂氛围,从而提高课堂教学有效性,培养小学生良好的数
随着互联网行业的快速发展,信息化服务产品越来越丰富,对于宽带质量也要求更高,宽带客户对于服务质量的敏感度也持续变高,而国内电信运营商对于宽带质量的改进没有能和客户所
以学生的体验为视角,比较留守与非留守中学生社会适应及其所处班级环境的情况,为学校创设促进学生社会化发展的环境提供参考。随机整群抽取3089名学生进行问卷调查,其中留守
随着全球健康医疗费用持续上升,亚健康人群趋于年轻化,老龄化数量的不断增加,慢性病已经成为影响现代人身体健康的最大威胁,因此,健康管理对于全球健康工业的推进具有非常重
<正>一、绪论虚拟研发组织是虚拟组织的概念渗透于研发组织中形成的新研发模式。相对于传统研发模式,虚拟研发组织可以不受时间和空间的限制,最大程度地实现不同组织或组织内
2010年4月,我国推出在中国金融期货交易所上市交易的沪深300股指期货合约。沪深300股指期货合约推出后,成交量逐渐放大。股指期货的主要功能是规避风险。主要探究了股指期货
本文系统介绍了图文电视的基本原理和相关技术,着重阐述了CCST传输数据包协议,分析其信道特征,比较现有几种制式的优劣。并在对图形制和代码制作出比较详细的研究之后,对应用较少
“异化”策略主张译文应以源语文化为归宿,提倡“存异”而非“求同”,在译文中体现源语文化特色,从而丰富译语表达。壮族独特的自然地理环境和社会条件,形成了意象丰富的壮族文化
我国大学生心理健康教育工作历经30年的发展,已走向了专业化、规范化的道路,但尚存一些发展中的问题。优化现有的高校心理教育模式,应定位于心理自助理念,构建大学生心理健康