基于机器学习算法的重复购买行为预测研究

来源 :重庆工商大学 | 被引量 : 4次 | 上传用户:zlyfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重复购买行为是营销学领域的研究热点。随着电子商务的快速发展,参与网购的用户越来越多,如何基于大数据预测用户的重复购买行为成为电商平台非常关心并想解决的问题。重复购买行为预测技术可应用于电商平台推荐系统中,帮助商家识别具有重复购买意向的用户,从而实现营销信息的精准投放。准确预测重复购买行为的关键在于通过模型算法挖掘出数据中所隐含的用户行为规律。然而,由于网购用户群体规模巨大且不同用户群体的购买行为规律具有很大的差异性,这使得数据挖掘工作变得异常困难。传统的机器学习算法在预测时忽略了用户购买行为规律的差异性,难以取得好的预测效果。因此,本文着重研究如何提高机器学习模型在重复购行为预测问题中的泛化性能,使其克服用户行为规律的差异性对预测性能造成的影响。本文在对现有机器学习算法进行研究的基础上,提出了细分化集成学习方法。该方法可以从数据集中学习到多种用户购买行为规律,提高了模型的预测性能。论文的主要研究工作如下。(1)重复购买行为影响因素研究。通过对电商平台用户购买行为数据的分析,从用户、商家以及商家和用户的关系三个方面挖掘影响重复购买行为的重要因素,并构建了52种与重复购买行为相关的特征。(2)现有机器学习模型的对比研究。论文对常用的机器学习方法进行了研究。实验结果表明,现有的机器学习模型预测精度普遍不高。Logistic回归、神经网络、决策树等单一模型在解决样本类别不均衡问题时存在局限性。集成学习方法虽然可以通过欠采样的方式解决类别不均衡问题,但无法有效的学习到具有差异性的用户购买行为规律,预测效果同样不理想。(3)细分化集成学习策略研究。考虑到目前的机器学习方法在预测重复购买行为时存在的局限性,论文对Bagging集成学习方法进行改进,提出了细分化集成学习。细分化集成学习通过在Bagging中设置强规则结合策略,使其能逐层过滤样本数据,从而实现对用户购买行为数据的细分。这种新的集成学习方法可根据细分后的数据集学到多种购买行为规律。实验结果表明,与现有的机器学习方法相比,细分化集成学习具有更好的预测效果。(4)预测模型的泛化性能研究。从泛化误差的角度对细分化集成学习模型的泛化性能进行了研究。通过对模型的泛化误差进行分解发现,细分化集成学习的样本过滤机制可以降低方差,因此具有更好的预测性能。
其他文献
<正>"家乡美、家乡美,最美是那柔柔的家乡水,水边的风儿轻轻吹……"每当我听到这首歌的时候,我不禁想起了家乡那迷人的风景、那清清的水、绿绿的树、柔柔的风、蓝蓝的天、白
<正>清代是我国历史上商业出版发展的繁荣时期,其时书坊林立,刻家蜂起,竞争激烈。书商为了宣传图书,促进销售,精心设计了许多行之有效的广告。本文拟从扉页、识语、书目等方
近几年来中国少儿出版增速快,增幅大,市场表现良好,未来潜力巨大,但也存在着成人化、娱乐化、功利化、低质化、低俗化等矛盾与乱象,有些甚至是非常尖锐与突出的问题,应引起出
目的:探讨急性期快速康复照护模式(ACE)在高龄共病住院患者中的应用效果。方法:选取2017年12月至2018年2月成都市第五人民医院老年病区高龄共病住院患者113例为研究对象,根据
中国画教学以其特有的形式在高职院校美术类专业教育过程中发挥着独特的作用。但当前由于各种原因.高职院校中国画教学在艺术教育中发展缓慢,濒临衰微之势。本人将着重从教学实
本文从煤矿开采活动全过程及各产污环节对整个煤矿区引起的土壤重金属污染诱因进行了系统分析,并提出要深入进行煤矿区土壤环境系统分析,在此基础上加强煤矿区土壤重金属污染
评估型绩效考核会激发被考核主管的阻碍性压力感知,进而导致负面领导行为的发生。通过198份样本的问卷调查,探讨了评估型绩效考核与领导辱虐管理行为的关系以及两者之间的中
中国在历史的长河中孕育出丰富的人文和历史,中国艺术表现形式多样化,中国画因其独特的民族风格、丰富的表现形式在艺术领域有着重要的地位和影响力。新中国成立以来,教育方
脑卒中西医称之为脑血管意外,是由于脑血管系统病变而引起的脑血管痉挛、闭塞、破裂,致脑局部循环损害和以偏瘫为主的肢体功能障碍的一类疾病。随着我国生活水平的提高,老年人口
居民出行时耗是反映居民出行特征的一个重要指标,同时也是方式划分模型标定的基础,以通过居民出行时耗的研究来把握城市居民出行特征规律为目标。选取国内具有代表性的发展形态