时间敏感的转化率预测和归因分析

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:hang_925
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据存储和数据分析技术的飞速发展,越来越多的企业选择通过电子商务(E-commerce)推广经销自己的产品和服务。电子商务的一个重要的组成部分即是计算广告(Computational Advertising),其中定向技术使各个性化的广告推荐成为可能。根据上下文信息和用户的反馈信息,在线广告系统将广告投放给最有可能给予反馈的用户。许多广告主都是用点击率和转化率评价其所投放广告的效果。通常较高的点击率和转化率表明一个广告活动为广告主吸引了更多的用户,也可以说该广告活动取得了很好的效果。在电子商务系统中,转化率(Conversion Rate)是评价广告或推荐的最有效的评价指标,它比点击率更直接的反应了广告的价值。转化率指的是执行特定行为的用户所占的比例,特定行为包括购买、注册或搜索等。"转化"这个词指的是一个将浏览用户变为真正消费者的行为。与点击率估计相比,转化率估计有两个技术难题:(1)如何正确的估计转化时间;(2)如何评价各个广告渠道对转化的贡献。用户的转化率与时间密切相关,例如向一个刚刚购人电视的用户继续推荐电视不会让用户再次购买。通常消费者不会在短期内重复购买同种大件商品,如汽车和房子。在一个错误的时间向用户推荐正确的商品,会错失一个向用户展示商品的机会。在真实的广告系统中,特别是针对行为重定向的广告系统,广告主最感兴趣的是哪些用户可能在短期内转化。另一方面,一个在线广告活动通常通过多个渠道投放广告,例如展示广告,付费搜索广告和社交媒体广告等。用户的一次转化受到多次广告的影响,用户的转化是多次广告展示的综合结果。因此我们需要可靠的归因机制来衡量不同的广告渠道对用户转化的作用,进而帮助广告主合理地优化广告活动。因此,本文针对转化率估计就这两个难题展开讨论和研究,主要贡献包括以下几个方面:(1)本文提出了一个新的研究问题:如何在给定的时间段内(如三天或一周)为用户进行推荐。针对这一问题,文本建立了一个基于威布尔分布的生存时间模型,用来建模个性化的转化时间。为了使模型更具完备性,该模型使用了贝叶斯框架进行正则化,并采用广义的EM算法进行参数估计。为了预测用户在一个特定时间段的行为,我们进而提出了一个基于排序的时间敏感的转化率预测模型。在两个真实数据集上展开的实验表明,本文所提出的生存时间模型可以很好的拟合用户的转化时间。此外,时间敏感的转化率预测模型对于在线广告系统和推荐系统的有效性也得到了验证,尤其是对于短时间的预测问题。(2)本文提出了一个新的数据驱动归因分析模型,命名为基于概率的多接触归因分析模型。该模型建立于概率的框架之下,同时考虑用户的固然转化率和转化时间。受到生存分析的启发,本文使用威布尔分布建模广告的转化延迟,并用其描述各个广告渠道的作用随时间的变化。将广告中的转化行为类比于生存分析中的死亡事件,本文用广告渠道的风险系数来定量的度量该渠道对用户转化的贡献。此外,本文将此归因分析模型应用于转化率预测任务。当广告主通过多个渠道展开一个广告活动时,广告主可以使用基于多接触归因分析的转化率预测模型策划或优化自己的广告活动。通过在真实广告数据集上展开的实验,我们验证了该归因分析模型的有效性。(3)针对广告转化的归因分析问题,本文还提出了一个累加性的多接触归因分析模型。在这个模型中,我们假设一个广告曝光的作用会随着时间衰减,同时浏览路径上的多次广告曝光对用户转化的作用是可以累加的。我们直接使用生存分析中的风险系数建模一次广告曝光对用户转化的影响,其取值取决于影响强度和随时间的衰减速度。根据广告对转化影响的累加性,我们用所有相关广告风险系数的加和来计算转化时间的分布。此外,本文提出了基于累加性的多接触归因的转化率预测算法,该算法同时考虑了用户是否会转化和用户会在什么时候转化。最后我们在一个真实的广告数据集上进行实验,实验结果验证了我们所提出归因模型的在转化率预测和归因分析两方面的有效性。综上所述,本文针对转化率预测中的两个难题展开了系统的研究,提出了一套基于生存分析和点过程的转化时间建模方法,并设计了时间敏感的转化率预测模型和两个基于不同假设的多接触归因分析模型。本文中的研究具有连贯性和可持续性,提出了转化率建模问题中与时间相关的难题的一套相对完整的研究方案。本文中的研究工作对现有理论、技术和模型的详尽分析和并开展了大量实验。在真实数据集上开展的实验和理论研究表明,本文提出的针对以上两个难题的研究思路和三个解决方案具有比较理想的效果。
其他文献
10月21日.由中国劳动保障科学研究院和中国劳动学会共同主办的“中国劳动论坛2010专题研讨会暨两岸三地交流研讨会”在厦门召开。人力资源和社会保障部副部长杨志明向会议发来
期刊
案情简介原告振兴公司于2009年2月向被告当地社会保险经办机构(以下简称社保机构)申请为企业职工参加工伤保险并缴纳工伤保险费。社保机构告知振兴公司,缴纳工伤保险费同时应一
随着社会的不断发展,三网融合已经成为当前媒体事业的主要发展趋势。在三网融合的背景下,媒体事业得到有效革新,并拓展出信息传播的新渠道。尽管广电网络取得了一定的发展成
8月16日,康斯特发布公告称,公司拟新设立全资子公司,作为公司投资建设位于张家口市怀来县东花园镇京北生态新城的'仪器仪表及传感器研发生产项目'的实施主体,并以其
期刊
东风汽车公司携旗下东风乘用车公司、东风商用车有限公司、东风日产乘用车公司、神龙汽车有限公司、东风本田汽车有限公司、东风悦达起亚汽车有限公司、东风裕隆汽车有限公司
在地面数字电视发射系统中,激励器的好坏直接影响系统的播出及覆盖效果,该部位的调整维护在系统的安全播出中起着关键的作用。本文介绍了数字地面电视发射机激励器的组成、工
近几年中国汽车市场尤其是豪华车市场的飞速发展吸引了全球的瞩目,嗅觉灵敏的零部件供应商也快速锁定目标。全球顶级的豪华汽车内饰供应商欧缔兰(ALCANTARA)已经悄悄在中国探路
为进一步推动和促进科技成果转移转化,深入推进实施创新驱动发展战略,通过对玉溪市科技成果转化工作的现状、存在问题进行分析,结合玉溪经济社会发展对科技创新的新需求,提出
自噬现象广泛存在于真核细胞中,是细胞的一种自我保护机制。这类分解代谢过程发生在细胞内,进化上具有高度保守性,在多种疾病及生命进程中发挥着重要作用。Sirtuin1(SIRT1)是