面向重复购买背景的预测模型研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:qiaobianhongyaogqw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展与应用普及和网民规模的迅速扩大,电子商务越来越适应时代的需求,其发展速度得到了大幅度的提升,使得已有的电子商务网站面临巨大的挑战,各大电商平台竞争日趋激烈。为了抢占市场份额,各个电商平台的商户在特定日期进行大型促销活动以吸引新的买家。为了获得更高的投资回报率,这些促销活动有必要针对那些有望成为重复购买(潜在的忠实)的群体展开。因此,研究如何运用客户的行为日志数据预测出潜在的重复购买客户具有很重要的现实意义。本文基于Tmall“双11”活动日当天的一些商户的新客户在活动日及之前6个月内的行为日志数据进行“重复购买预测”的算法研究。首先本文通过分析影响重复购买的因素从而设计特征工程提取特征,并提出一种基于支持向量机(SVM)和随机森林模型的组合预测算法,该算法在实验中获得了很高的性能表现。其次,本文还提出了一种基于深度神经网络的预测算法,运用深度神经网络从大量训练样本的分布中自动学习出有效的特征。在该算法中,“词嵌入”首先被用于对原始特征数据进行编码,然后将编码后的词向量作为深度神经网络模型的输入,进而预测出重复购买的结果。本文的工作主要包含以下几个方面:(1)设计特征工程。通过分析影响重复购买行为的因素,提取出客户特征、商户特征、客户与特定商户的交互特征、年龄与性别等多个维度的特征;在深度神经网络模型中,利用词嵌入编码原始特征数据并设计特征子模块模型生成特征向量。(2)研究单一模型与融合模型在特征工程上的运用。分别使用支持向量机(SVM)和随机森林进行建模,最后将模型结果进行融合发现,组合模型能互补各个模型的优势获得更好的预测结果。(3)提出一种基于深度神经网络模型的重复购买预测算法。使用有效的方法构造多层神经网络;在底层先通过词嵌入模型对原始特征数据进行词向量编码,然后设计特征子模块生成特征向量,最后在模型的顶层进行预测。
其他文献
电压空间矢量(SVPWM)调制方式把逆变器和电机看作一个整体处理,具有所得模型简单,便于数字化实现,并具有转矩脉动小、噪声低、电压利用率高等优点。近年来在变频调速系统中逐
随着我国国民经济的飞速增长,与高层建筑施工相关的工程技术也取得了不断的进展,鉴于高层建筑有着与普通建筑不同的特点,使得高层建筑施工难度加大,同时高层建筑在施工过程中
目的探讨唑来膦酸对骨肉瘤患者外周血单个核细胞(PBMCs)来源γδT细胞杀伤骨肉瘤作用的影响。方法使用唑来膦酸联合IL-2体外扩增原发性、复发性和转移性骨肉瘤患者PBMCs来源
C/C复合材料是碳纤维增强的碳基材料体系,因其具有耐热性高、摩擦性能高并稳定、力学性能和物理性能高而代替了高速飞机和重载飞机制动装置中的其他材料。但C/C复合材料在温
文章根据课程设计中理论学习与实践学习的关系,按照"理论与实践并行""理论为实践服务"和"理论实践一体化"三个发展阶段,对近年来我国职业教育课程领域的研究和实践进行了系统
物元分析是解决矛盾问题的规律和方法,是系统科学、思维科学和数学的交叉学科。本文简单分析了物元概念的可拓性,通过以湖南湘西为例,应用物元理论知识分析说明危岩、滑坡灾
农村地区受洪水侵袭危害巨大,防汛预报预警是防汛工作的重中之重。文章针对淮阴区建设农村基层防汛预报预警系统,实现水雨工情数据的采集、传输、处理和预警消息发布等功能,
梳理闽台民间美术元素在环境设计中的表现方式,运用闽台民间美术的特色元素进行环境艺术设计,以创造出更具民族特色与文化底蕴的现代高品质生活环境空间。研究闽台民间美术元
期刊
就工作面宽度与关键层位置判别的关系以及基于薄板模型的关键层判别方法存在的局限性进行了研究。结果表明:一般情况下,各硬岩层的破断顺序是由各硬岩层步距准数所决定的,与工作