论文部分内容阅读
近年来,随着互联网的高速蓬勃发展,大型在线社交网络、在线广告等各项互联网服务越来越普及。与此同时,用户行为的建模分析问题也变得越发重要。例如在病毒式营销中,如何通过对用户网络中的行为建模与分析定位到影响力最大的用户群,从而增加营销的效率,对提高投资回报是非常重要的。再例如在线广告活动中,通过对用户行为建模,分析出不同渠道的广告对用户购买决策的影响,重新合理分配广告预算,对提高在线广告投资回报是非常有帮助的。高速发展的互联网服务产生了海量的用户行为数据,成为了用户行为建模分析的良好平台。面对海量的用户行为数据,如何对用户行为建模,发现用户行为模式,对用户行为进行预测,是本文的主要研究问题。本文主要在两个场景下展开用户行为建模、分析和预测:在线社交网络和在线广告。在社交网络中,如何对信息传播以及用户对信息的交互行为进行建模越来越受到人们的关注。信息传播路径不仅反映了用户之间的影响关系,帮助我们估计隐含的用户影响网络,还能帮助我们发现信息本身的传播特性。在本文中,我们通过对信息传播路径上的连续时间事件进行分析,同时对用户影响网络和信息热度进行建模。我们基于多维霍克斯模型,提出了一个拓展模型,不仅能对社交网络中用户之间的行为互激励现象进行很好的模拟,同时融合了对信息热度的估计。在我们提出的模型中,用户影响网络和信息热度被统一起来,两者互相增强,从而同时加强了对两者的估计。我们在模拟数据集以及真实数据集上的实验结果表明,我们的算法效果都优于现有算法,并且通过观测数据很好的估计了信息热度。在线广告里,如何根据用户的行为数据,对用户行为建模,进而预测用户购买行为,以及计算不同广告渠道在广告活动中的贡献度越来越受到工业界以及学术界的关注。在线广告,相比于传统广告(如电视广告、印刷广告等),产生着海量的可追踪的用户数据,利用这些数据我们可以建立用户行为预测模型和广告归因模型。在工业界传统上基于规则的模型已经被广泛使用,但是基于规则的模型的缺点是它的规则是基于简单的直觉得出的,而非从数据学习得到的。数据驱动模型有着很强的追踪广告投放,以及用户和广告之间的互动关系的能力,成为了这一领域的一个重要的研究方向。我们提出了一个新的基于生存理论的数据驱动模型。通过采用了概率框架,我们的模型的一个重要优点是,能够去除其他基于简单规则模型的固有偏见。我们的模型除了能够预测用户购买行为的概率,同时还能进行广告渠道贡献度计算。我们在从一家商业广告监测公司获得的真实数据集上验证了我们的方法,实验结果表明我们提出的模型在用户购买行为的预测,和广告渠道贡献度计算这两方面都有很好的效果。