基于复杂网络的消费者再次购买行为预测研究

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:xuhailinxhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国电子商务行业发展迅速,从电脑端网站到移动端APP,人们的消费热情不断被激发,在线购物逐渐普及,现有用户近8亿人。目前电子商务行业中各企业之间的竞争进入了白热化阶段,对于平台和企业来说,吸引新用户的成本越来越高,如何使老用户源源不断的进行再次购买是提升业绩的关键。但是,和传统的消费环境相比,在电子商务消费环境下消费者的消费习惯有很大差异,比如,由于商品信息的增加和透明化,消费者的选择范围和选择难度都在加大,并且伴随着转移成本的降低,其忠诚度也在降低。越来越多的学者也基于在线购物中的大数据对消费者的再次购买进行了更加深入的研究,希望有助于增强平台、商家的营销效果,实现更高效的客户关系管理。然而,目前针对再次购买的预测研究主要集中在使用机器学习的方法进行预测,忽略了模型的可解释性,对于营销、运营相关人员来说参考性不强,并且针对行为数据建模的方式有待进一步完善。因此本研究将聚焦如何基于消费者的点击流数据以及购买行为数据进行建模,对消费者行为进行更好的刻画,使得模型兼具解释性和预测的准确性。本文在消费者再次购买的理论研究和在线购物决策研究基础上构建了相对完善的再次购买指标体系,从复杂网络的视角构建了商品网络,提出了一个整体的计量框架。本研究的主要内容如下。(1)再次购买指标体系构建。本研究梳理了消费者再次购买相关理论研究和预测研究,基于期望确认理论构建了基本的再次购买指标体系;另外,为了更好的刻画消费者浏览行为、从行为数据中提取指标,本文以消费者在线购物行为理论中的EKB模式为基础,对消费者浏览商品过程中的“信息比较”行为进行建模,构造了商品浏览次数、浏览时间等指标;更重要的,考虑到浏览过程中存在商品被查看的先后顺序,我们从复杂网络的角度构建了商品之间的有向网络图,并且使用社会网络分析的方法提取了商品的度中心性、特征向量中心性等指标,这些指标可以反映商品的热度和消费者的偏好。总的来说,我们构建了用户基础指标、商品基础指标、消费情境基础指标和用户行为指标,从这四个方面挖掘了影响消费者再次购买行为的关键因素,共40个指标,考虑虚拟变量共计有53个。(2)基于LASSO的变量选择。为了避免冗余变量导致的预测模型过拟合问题,本研究采用LASSO变量选择方法对这53个变量进行筛选。首先对连续型变量进行相关性分析,发现部分变量之间确实存在强相关性,因此使用LASSO对变量进行选择,根据100次实验的结果对变量进行投票,最终有26个变量被选中,其中包括9个用户基础指标、1个商品基础指标、4个消费情境指标、12个消费者行为变量,说明消费者的再次购买除了和自身需求、商品性能、外界促销刺激有关之外,和在线浏览行为、过往购物记录同样有着重要的关系,这些行为相关的指标对于预测再次购买有着重要意义。(3)模型评估。为了评价本研究中计量模型的效果,本文从两方面对模型进行评估。一方面是模型的拟合效果,另外一方面是模型的预测性能和泛化能力。首先,针对模型的拟合效果,为了进一步了解各指标对再次购买的影响,本文构建了4个模型,使用逻辑回归方法对这些模型进行了样本内估计,估计结果表明,经过LASSO变量选择之后的模型中系数显著性更强,同时从拟合性能指标AIC、麦克法登的伪R方来看,模型的效果较好。其次,为了选择预测精度更高、鲁棒性更强的预测模型,本研究基于不同的变量组合构造了5个模型,针对这5个模型分别应用逻辑回归、决策树、支持向量机、随机森林、XGBoost这5个经典机器学习算法,共生成了25个子模型,每一个子模型都进行了100次实验,计算得出模型的平均精度和标准差,并结合敏感性分析、鲁棒性分析验证不同指标的重要性和模型的稳定性。研究结果表明用户的频域类行为特征和网络特征对于再次购买行为预测精度的提升存在明显作用,相较于基础模型,这些特征的加入使得各算法的预测准确度增加10到25个百分点;另外,从模型鲁棒性的角度来看,随机森林、XGBoost等聚合类算法也更适用这一类数据,同时,经过了变量选择的模型表现也更为稳定。总的来说,本文旨在系统性的研究如何对消费者的行为数据进行建模,并应用于再次购买的预测。通过将点击流数据引入消费者再次购买的研究,构建了商品之间的网络,完整地反映了消费者的浏览路径和购物偏好,系统的构建了一个较为完备的再次购买预测框架,丰富了消费者行为建模的方法,并且初步确定了消费者相关行为特征对于再次购买的影响。研究结果表明,消费者的再次购买行为受自身需求、商品性能、消费情境的影响,在这些指标的基础之上,消费者的浏览行为也极大程度上反映了其购物偏好,基于点击流数据构建的频域类特征和网络特征对于预测的精度都有明显的正向影响;其次,使用网络对消费者决策过程中的“信息比较”建模是理论上合理、结果上有效的,较好的解决了数据量大但是信息量匮乏的问题。本研究对于电子商务中的推荐算法改进、营销和运营决策都有一定的意义。
其他文献
随着人工智能技术和机器人流程自动化技术(RPA)的发展,传统的审计工作面临较大变革。审计自动化、审计智能化与审计数字化逐渐成为未来审计领域的发展趋势。因此,融合人工智能技术与RPA技术对发现企业财务舞弊、提升审计质量与审计效率具有重要意义。传统的审计模式需要跨越多个系统或应用,这些繁琐、重复性强的操作仍需审计人员手动完成,现有研究仅将新技术应用于审计的某一方面或某一特定任务,例如合同分析、收集证据
学位
随着机器学习与深度学习的不断发展,计算机视觉已经逐渐成为各大领域持续研究并应用的领域,因此异常检测技术逐渐出现在人们日常生活中的方方面面,尤其是在工业工厂领域,异常检测技术的不断成熟不仅提高了缺陷产品的检测率,减轻了工人的劳动时间与工厂的用人成本,而且极大地降低了工厂因缺陷产品而产生的成本。但是面对异常样本十分稀缺的情况下,如何训练模型来提高检测缺陷产品的准确性就成为了异常检测领域中一个需要解决的
学位
现如今这个时代人类的精神生活高度饱和,人们可以借助各类社交点评软件来表达自己对于各类事物的意见和看法,这同时也是表达自我感情的过程,会有大量的情感倾向特征应运而生。基于评论数据的情感分类可以度量出用户的情感走向,不仅可以据此实现个性化推荐,还可以依据情感波动对现实生活中的诸多事物进行切实的改进,因此其隐藏的社会价值十分有意义。但是传统的文本情感分析任务往往并没有考虑到性格这类本质性的人格特征对于人
学位
区块链经历了从数字货币技术到可应用于各行各业的发展和演变。区块链作为新兴技术,逐渐引起了中央和地方政府的重视,在2019年的全国两会上也被频繁提及。其实,早在2016年,中国政府就开始了对于区块链技术的探索。智能合约相当于是一个“不可改变”且“公正”的“中间人”,协议条件满足就会强制执行该合约,由不得赖账。但是一直以来,智能合约缺少相应的技术作为支持,所以在被提出的时候没有很好地发展下去。而区块链
学位
现在深度学习方法已经广泛应用于医学界的各种疾病检测中,为医学工作者带来了诸多便利。从2019年武汉新冠肺炎(COVID-19)疫情爆发至今,全国乃至全球人民都不可不避免地受到疫情的影响,为此各大医疗机构都加设了疫情专区,以便更有效、安全地服务患者。另外,新冠肺炎作为肺炎疾病的一种,在临床表现上有许多相似的地方,例如都会表现出咳嗽、呼吸困难等症状;在影像方面,无论是X射线检测影像还是CT影像,两者也
学位
随着计算机运算能力的不断提高,信息的存储和利用方式变得越来越简单和多样化。其中知识图谱是一种将现实世界中复杂事物关系挖掘出来并且将其可视化的技术。近年来,大数据技术以及人工智能产业的快速发展成熟,能高效准确处理海量信息的强大机器学习、深度学习算法等被应用在了各行各业的研究中,尤其在自然语言处理界,深度学习的发展大大促进了各领域知识图谱的广泛应用研究。金融行业是一个具备庞大复杂数据信息的领域,同时也
学位
随着我国经济的繁荣增长,我国证券市场不断发展,但离有效市场尚有差距,存在利用历史财务和因子数据获取超额收益的空间。对于弱有效市场,采用多因子选股模型构建股票组合是战胜市场的有效办法。面临海量的财务和因子数据,机器学习算法能够有效捕捉其中的股票信息以预测未来股票涨跌,进而帮助选股。此外,随着股指期货、融资融券等新型衍生品工具的推出,Alpha对冲策略也能够引入投资策略,帮助抵御市场的系统性风险,获得
学位
复杂网络存在于现实生活中的方方面面,例如合作作者网络、社交网络、俱乐部网络等。复杂网络存在一个重要性质,那就是它的社区结构,研究人员可以通过在复杂网络中挖掘其社区结构来加深对复杂网络功能和拓扑结构的理解,社区发现应运而生。社区发现可以用在很多领域,如市场营销、生物学、医学、计算机科学等等,这也吸引了大批研究人员提出自己的社区发现算法。社区发现在实际生活中也有重要应用,例如对微博、小红书、豆瓣等社交
学位
贫困一直是人类关注的重要问题之一,自改革开放至2020年我国脱贫攻坚取得全面胜利。但我国的贫困问题并没有完全解决,农村地区的减贫依然面临一系列挑战。此外,中国信息化建设对农村减贫发挥着重要作用,农村地区宽带普及取得长足发展,城乡差距正在逐步缩小。这一定程度上依赖于我国对宽带基础设施的建设投资。2014年,国务院为推动农村宽带基础设施发展推出“宽带乡村”政策,“宽带乡村”政策实施对农村减贫产生的影响
学位
步入新时代,中国经济正在由高速增长阶段转向高质量发展阶段。创新、协调、绿色、开放、共享的新发展理念体现在高质量发展中。物流业作为经济发展的基础性、战略性、先导性产业,与经济发展关系十分密切。京津冀地区既是“京津冀协同发展”及“一带一路”国家战略的叠加辐射区,又是物流现代化示范区及交通运输现代化的先行区,具有发展物流业的区位优势。物流业与经济发展的关系理应互利共赢,体现出一体化协调发展的优越性。但现
学位