基于逻辑回归的在线广告CTR优化和预测

来源 :浙江大学 | 被引量 : 0次 | 上传用户:Destory
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
点击率(CTR)预测是互联网公司中重要的研究课题,其结果与上下文、用户属性和广告属性息息相关,CTR的有效预测对于提高其公司的收入至关重要。CTR预估中最常见的模型是逻辑回归(LR),然而LR实质上属于广义线性模型。对于计算广告而言,特征变量不仅多,而且特征与特征之间存在关联。一方面,实际业务需要快速有效的筛选特征并进行特征组合,这在很大程度上只能依靠人工经验,耗时耗力同时并不一定会带来效果的提升。另一方面,广告数据是实时产生的,批量的处理会面临时效性等问题,在线计算就显得尤为重要。本文在对传统LR模型的相关原理和参数优化算法介绍的基础上,抽离出用户特征和广告特征,并用XTAS(XTAV)T表示用户与广告之间的关联,将其添加到sigmoid函数中得到新的LR模型。和以往求解方法不同的是,本文采用在线最优化算法FTRL提高参数计算效率,采用混合正则化来防止训练过拟合。在实验部分,我们主要考虑AUC和log-loss两种评估指标,根据之前的模型和算法,最后从准确性、参数敏感性和可靠性分析并得出结论。本文的主要成果体现在三个方面。第一,本文考虑了用户与广告的特征关联,且根据关联矩阵的稀疏性和大规模等特点将其分解,从而使得其比传统的LR模型有着更强的非线性拟合能力。第二,本文的模型能自动消除无用的特征,使得在线预测更加迅速,尤其对于大规模稀疏性数据和特征。第三,利用FTRL在线算法,能实时处理数据,效率高且避免了批量处理。
其他文献
随着互联网技术的迅速发展,人们的生活逐渐迈入信息化和网络化时代。社会交往和购物活动均一定程度地从线下转移到线上,使得社会化媒体和电子商务的发展迎来了爆发期。与此同
随着当前“注重客户体验”的经营理念在B2C电了商务行业逐步深入,电子商务营销的重点已经由商品和服务的功能导向,渐渐转向满足消费者更好的购物体验感受需求导向。这也是由
【目的】通过对宁夏六盘山叠叠沟小流域典型林分类型白桦林和华北落叶松林枯落物水文效应的研究,为深入揭示该区域森林水文效应研究提供科学依据.【方法】采用野外观测和室内
伴随中国现代化的水平逐渐得到提高,工业以及制造业的水平均获得非常突出的进步。建筑行业当中,建筑工程的占地面积以及高度均在持续上升,尤其是对于城市的地标建筑物的施工
<正> 所谓气溶胶是指在气体介质中具有相对稳定的液滴或固体颗粒的悬浮物。利用不同的技术手段制成的气溶胶的表现特征,不仅取决于它的制取方法,也取决于物质固有的物理、化
目前,中国农村经济发展已进入市场化、城市化、信息化“三化融合”的发展过程,虽然电子商务在城市已得到迅速发展,但是,在广大中国农村地区,电子商务技术的发展还有待进一步
生物安全的概念现今已越来越多的被大众所熟知,不仅仅只存在于实验室,医疗卫生、环境保护等更多的领域开始提出生物安全的重要性.靠什么起到生物安全?硬件上最终要通过高效过
目的了解中山市中央空调冷却塔水血清1型(LP1)及血清7型(LP7)嗜肺军团菌脉冲场凝胶电泳(PFGE)分子分型情况。方法对2012—2014年从中山市部分酒店、娱乐场所、商场、医院等公
应用广义能量释放率及动态断裂理论,结合粘弹性效应建立了PBX炸药的统计细观损伤本构模型,将该模型嵌入到Ls-dyna有限元程序中对平面撞击实验进行了数值计算.通过与实验结果比较
<正>《西部中医药》由甘肃省卫生和计划生育委员会主管,甘肃省中医药研究院、中华中医药学会主办,是全国中医药优秀期刊,中国科技核心期刊,甘肃省优秀期刊,被中国知网、万方