论文部分内容阅读
行为定向(Behavioral targeting,BT)是基于单一客户(客户群)消费、浏览等历史行为,利用科学的预测模型和算法,预测其未来消费需求的一种技术,是伴随着现代统计学在电子商务广告服务领域里的全新应用而被提出和推广的。在电子商务领域,客户的所有网上行为都是可追踪的,这为商家开展行为定向提供了极为有利的条件。目前,国际上在行为定向领域走在最前面的应当属Yahoo!,他们积极与学术界合作,将行为定向研究成果运用到其广告业务上,并带来了显著的经济效益。随着近年来国内电子商务产业的爆炸式发展,基于电子商务的行为定向方法研究越来越得到国内各界的重视。如今,从事电子商务的商家数以万计,产品类别纷繁复杂,当当网仅图书一项就超过60万的产品种类,如何在如此海量信息中将更有价值的信息脱颖而出,吸引到客户更多眼球已经成为所有在线商家不得不面临的问题。相较于传统商业模式,电子商务可凭借企业的Web服务器和客户的浏览,在Internet上将海量的商业信息发布给在线客户,并且可以利用网上主页(Home Page)和电子邮件(E-mail)在全球范围内作广告宣传。与以往的各类广告相比,网上的广告单位成本最为低廉,而给顾客的信息量却最为丰富、多样化。然而,很多网站都存在这样的困扰:他们投入大量金钱投放的广告,由于目标客户模糊不清、信息过于宽泛,往往并没有达到他们预期的效果,即使消费者进入了网站,也很少采取站点期望的互动行为,来去匆匆,网络广告的效果极不理想。这就引出了行为定向的商业意义。
本文以某个电子商务商家提供的大量客户在线行为数据为依据,借鉴已有的行为定向研究成果,综合利用统计学、管理学等学科知识,在Matlab、遗传算法等工具的帮助下,创新式的研究了不同活跃程度客户的行为中需求偏好的表现形式、不同时间段数据对客户突发性的动态定向中的权重差异以及基于品类的浏览关联性等问题。本文的创新点在于,有别于现有的基于不同行为形式(浏览、购买、搜索、列示、收藏)或是基于不同客户人口信息识别(性别、年龄、收入等)的行为定向研究,本文将从不同客户的活跃程度出发,研究行为定向中的几个重要问题,并试图从中发现规律性认识,并建立一个较为可行的行为定向模型。经过大量的实证分析,研究得到了以下结论:⑴对大部分客户而言,无论是长期还是短期,其行为都会表现出一个在该段时间内相对稳定的需求倾向特征,并且这种需求倾向特征具有一定的延续性。同时,长期需求倾向比短期的表现更显著,也更稳定。⑵不同时间段的行为数据在预测模型中的权重是存在显著差异的,然而这种差异并非我们之前所想的那样有一个明显的趋势,实证分析的结果只能证明距离预测点大约一周的数据权重要大于两周,而具体到某一天的行为数据,却无法证明这种显著差异的存在。同时,相比利用近期数据捕捉客户突发性的动态需求而言,利用中长期数据探索客户相对稳定的需求偏好对预测结果的提高将更为有益。⑶客户需求倾向的表现力与客户的活跃程度呈现出较强的正相关性。同时,活跃客户的浏览行为更多的受到的是长期需求偏好的影响,而活跃程度较差的客户的浏览行为则是受短期内的突发需求影响更多。⑷结合规律性认识,本文得出了一个基于单一客户的,以预测点前一天、前一周、前一个月浏览需求值为变量的行为定向模型。经过后续数据验证,该模型可以在大大减少运算量的前提下,实现预测效果的显著提高。⑸从品类之间的浏览关联性出发,我们发现了一些比较有趣的关联品类,例如“女士内衣/男士内衣/家居服”与“女装/女士精品”(61%)等等,这种关联度在一定程度上可以反映出由产品的使用价值而决定的浏览客户的人口属性特质,例如性别、年龄等等。同时,同一个品类被连续两天浏览的概率其实并不大,这也从另一个角度证明了距离预测点最近的数据对预测准确度的帮助并非一定显著高于稍远一些的数据。