B2C环境中服装类产品的退货率预测及影响因素研究

来源 :江苏科技大学 | 被引量 : 2次 | 上传用户:tiankuangfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
B2C环境中的零售商在日常运营中会经常面临影响工作效率的事情,而这种无效的工作缘由包括很多种,其中一个主要问题就是退货。现有研究中已经说明了众多网络购物中会产生退货的原因,但较少有学者研究退货的影响因素是如何作用于退货率。本文根据德国某家线上零售商服装类产品的订单资料,对数据集展开了探索性分析,并针对退货率影响因素和退货率预测问题分别展开了研究。(1)利用多种可视化分析技术对数据集中的变量展开了探索性分析,并对原始数据的缺失值采用热平台插补法进行插补,填补后剩余的缺失值与四分位距之外的异常值共同采用随机填补法进行重新填补。在原有数据集中的变量基础上,重新构建了年龄、发货时间、会员时长和购物篮大小四个变量。经过处理后,本文对数值型变量进行初步的标准化处理,对分类型变量进行了独热编码。(2)将处理后的数据集以7:3的比例分别划分为训练集和测试集,分别纳入退货率影响因素分析模型中,本文利用Logistic、CART、NNET、GBM算法和Xgboost算法五个预测机制综合分析了价格、尺寸、颜色、发货时长、年龄、会员时长、购物篮大小、城市和性别九个因素的重要性。不同模型对变量重要性排名不一致,但价格和购物篮大小两个变量为得票率最高的较为重要的两个变量。(3)利用混淆矩阵得到的准确度、真正率、真负率、F值和AUC六个指标对五个模型在退货率预测问题中的表现进行了对比。结果表明,在准确度、真正率、F值和AUC指标评估下,Xgboost算法、GBM算法及分类树模型在训练集和测试集中的表现普遍比Logistic和神经网络模型优异;在准确度和AUC值两个评估指标下,Xgboost算法优于其它预测模型,ROC曲线也进一步验证了该结论。但在真负率指标评估下,神经网络表现最佳。(4)利用不同规模的训练集与测试集拟合模型,并对比模型在不同指标下的表现优劣程度。结果表明,在准确度、真正率、真负率、F值和AUC指标评估下,数据集的大小对模型对退货率预测的表现没有明显影响,但是在精准度指标评估下,差异较为明显。
其他文献
在养羊生产中,很容易出现布鲁氏菌的感染,加强对布鲁氏菌感染的预防与防治显得尤为重要。本文介绍了该病病原及其流行的特点,该病的临床症状,以及诊断的过程,并浅显的提出了
水力发电是清洁的可再生能源,促进水电的发展及改善其性能对抑制和削减温室效应气体、提高电力系统稳定性都是有利的。为了提高水轮机效率、改善气蚀性能和扩大水轮机稳定运转
<正>建议贵州省继续推进"放管服"改革,完善服务业的行业管理体制,深化服务业供给侧结构性改革,扩大服务业对外开放,优化服务业发展环境,推动服务业健康可持续发展2016年以来,
遥感影像在社会经济发展中所发挥的作用也更加重要,它能够真实记录地表形态、植被覆盖、自然景观和环境状况,可广泛应用于城市环境整治、旧城改造、市政建设、城市管理等众多
<正>1卫生间的防水设计在实际生活中,很多时候发现与卫生间相邻的房间漏水,而在维修时则发现这些漏水都是来自卫生间。出现这种情况的原因是,水是从卫生间门口处的
另类的五代机$$俄罗斯第五代战机T-50为单人单座双发重型隐身战斗机,后掠翼气动布局,由俄罗斯联合飞机公司苏霍伊航空集团研制。该机具备隐身性、起降距离短、超机动性能、超声
报纸
随着农业生产规模的不断扩大,农民为了追求更多的经济利益,而不断加重农药在农业生产中的使用量,导致农药在农产品中的残留度超出规定、同时也致使环境污染、操作人员中毒等
绩效评价是公立医院医疗卫生服务及医院运营管理从数量发展向质量提升的时代要求,是公立医院提高财政投入经费使用效益的现实需要,是顺应并推动医改,促使公立医院回归公益性
<正>1发病情况体重为5kg的雄性博美犬,年龄7岁,主诉该犬在近半个月前肢触地时有哀叫,2天前被另一条犬追咬受到惊吓,第二天早晨表现精神沉郁,食欲废绝。前肢触地敏感,触碰时偶
目的:以补骨脂-三七药对为例,从整合药理学角度探索补肾活血法治疗骨质疏松症的作用机制。方法:基于整合药理学平台(TCMIP),收集补骨脂、三七的化学成分信息,以“osteoporosi