基于数据挖掘的实体零售业销售额预测研究

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:xulee_jj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精准的销售额预测能够帮助企业管理者有效的制定经营规划,进而使经营策略和工作计划更加有效和准确,提高企业综合竞争力。当前国内外基于零售业销售额的预测研究,通常使用时间序列分析预测方法与机器学习建模预测方法。时间序列分析预测方法在预测中突出了时间因素的作用,没有将外界的影响因素考虑在内,所以当外界环境变化较大时,预测值往往会有较大的误差。机器学习建模预测方法分析的是影响预测的全部因素,预测方法灵活高效。但是单独的机器学习建模预测方法基于预先假设,这种假设具有局限性,导致单个模型无法包含数据中的全部信息,需要组合多种模型建立混合模型进行预测。本文的研究重点是基于现实销售数据建立混合模型,提高预测模型的预测精度与泛化能力。本文的研究对象是德国实体零售业巨头Rossmann公司的多家商店销售数据与商店信息数据,对这些数据进行探索性数据分析,分析各变量对商店销售额的影响并进行可视化呈现。针对数据集特点进行数据预处理,搭建特征工程,比较了线性回归、随机森林、支持向量机、XGBoost模型在销售额预测上的表现,初步发现XGBoost模型在数据集上的预测精度评价指标最优。为了进一步提高XGBoost模型在预测销售额时的精度与泛化能力,设计了一个基于聚类算法与XGBoost模型的混合模型PCA-K-Means-XGBoost。该混合模型包括主成分分析,K均值聚类和XGBoost回归,对特征集降维之后选择最优的聚类类数,对聚类后的不同类别数据分别训练XGBoost模型,混合模型后进行最终预测。实验结果表明,PCA-K-Means-XGBoost混合预测模型进一步提高了预测精度与泛化能力。同建立单个模型进行预测的方法相比,混合模型能够包含原始数据集的全部维度信息,更适合应用在如零售业销售额预测这样信息繁多的预测领域中。
其他文献
这是一家与勺子有着深厚渊源的店,找一个悠闲的下午,去探寻勺子的各色风情吧。
期刊
近日,由课程与教学研究院主办的“基础教育学科课程改革重难点问题暨课程教学论学科建设研讨会”,在我校召开。与会专家学者就当代社会变革背景下的课程与教学论学科发展趋势、
【正】 前人对于中国传统家庭的分析,通常有“大家庭”和“小家庭”之别。所谓大家庭,是指由两对及两对以上的配偶组成的家庭,具体又可分为:由父母和一个已婚子女组成的“主
文章运用1998—2007年上市公司及会计师事务所的数据,首次实证检验了会计师事务所客户组合风险管理的最优策略,结果发现:就整体而言,事务所接受的新客户的风险最大值与诉讼损
在过渡金属催化和有机小分子参与下,α,β-不饱和酮与烯丙醇可顺利地发生Morita-Baylis-Hillman(MBH)反应,生成相应的烯丙基化偶联产物.该MBH反应具有原料易制备、与许多官能
改革开放30年来,中国刑法学理论研究取得了可喜的成果。主要表现在刑法的基本观念、刑法学方法和体系、犯罪构成理论、刑事责任和刑罚理论以及刑事政策等方面。 30 years of
目的:探析对慢性胃病患者应用半夏泻心汤治疗的临床效果。方法:选取2016年10月至2017年9月期间入我院接受诊疗的82例慢性胃炎患者作为研究对象,根据不同治疗方式将其分为观察组
<正>高温季节,商品肉鸡在运输过程中由于运输环境和人为因素等刺激,很容易造成机体损伤和体重的损失,致使机体在短时间内难以恢复正常,生理代谢功能出现异常,体重明显减少,肉
现如今,银行业的经营垄断已被打破,面对国内银行的竞争和国外银行的威胁,在内忧外患的紧迫情况下,从资源基础理论的观点看,客户已成为银行的关键资源。且在金融业混业经营的
目的:应用共振频率分析仪评估Straumann种植体植入后稳定性的变化以及影响种植体稳定性的相关因素。方法:28例牙齿缺失患者共植入35枚非潜入式Straumann种植体,在术中、术后1、