基于机器学习的零售店销售额预测研究

来源 :长安大学 | 被引量 : 0次 | 上传用户:diaolan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,网上购物已成为时尚并促进了电商行业的飞速发展。但这也给传统的线下实体零售业带来巨大的生存压力,实体商家迫切需要采取有效措施对未来销售的趋势做出可靠预测,帮助其制定合理的销售目标,指导运营后台提前进行合理的资源配置,以降低运营成本从而提高竞争力。因此,本文提出并实现了一种基于机器学习及深度学习理论的零售店销售额预测方法。本文对当前几个主流预测方法进行了分析,发现时间序列预测法仅适用于线性问题,没有考虑到历史销售数据中的非线性问题,导致建立的模型预测精度低;神经网络尽管对非线性问题具有较高的预测精度,但对输入数据特征的形式有很高的要求,缺乏泛化能力及收敛速度慢;组合模型虽然可以对上述两类模型进行优化,取得不错的预测结果,但只适合处理特定问题,同时模型训练时间会更长等不足。针对以上问题,本文使用XGBoost模型、LightGBM树结构模型和长短期记忆网络(LSTM)模型及模型融合方法,以德国Rossmann公司1115家实体店的销售数据作为研究对象,分别使用三种单模型和四种融合模型对销售额进行预测。首先通过特征工程和参数调优对三种单模型进行训练并验证;然后采用三种不同权重的加权平均法和stacking学习法对三种单模型进行融合,通过优化参数和交叉验证方法对四种融合模型进行优化并验证;最后,采用MAPE和RMSPE两个评价指标来对模型进行评价,并对比几种模型的MAPE值及RMSPE值。实验得到单模型的MAPE值及RMSPE值分别在0.049和0.065以上,而融合模型的MAPE值及RMSPE值分别在0.047和0.062以下的结果。表明单一模型法虽然有效、可行,但是融合方法能够有效提高模型的预测精度及泛化能力,可获得比单一模型更好的性能。
其他文献
在医疗健康、航空航天、农业生产和能源产业等领域,对温度、湿度、振动和压力等参数的实时监测具有重要意义。声表面波(SAW)传感器利用机械波-电磁波的相互转化实现无线传输
背景:现代战争背景下的海战,由于高燃高爆武器的高频率使用和战场载人作战装备高比例配属等特点,水面舰艇、潜艇及两栖作战力量将会出现以烧伤伤情为主的大批伤员,其中,各种原因引起的吸入性损伤将是此类伤员早期主要死亡原因之一。快速、准确诊断吸入性损伤,实施及时规范的早期救治,并对相关卫勤保障人员实施高效针对性训练,将大幅减少其伤死率,提升我军未来海战中此类伤员的救治效率,从而达到提升保障能力,保存战斗力的
再生器外取热器是炼油厂催化裂化装置的一个重要设备,目前工业装置广泛采用的是设置有多根垂直换热管束的密相外取热器,但存在非正常流化、温度不均、冲蚀磨损爆管等问题。随
随着我国城市化建设的不断加快,工业化程度不断提升,二氧化硫、氮氧化物以及颗粒污染物等大气主要污染物的城市污染问题越来越严重。本文使用2017年哈尔滨市全年空气质量监测数据为依据,对6种大气污染物(SO2、NO2、O3、CO、PM10、PM2.5)的质量浓度进行分析,借助AQI(Air Quality Index,空气质量指数)评价体系对空气质量状态做出直观阐述,探讨了污染物浓度变化与气象因素的关系
肾病综合征是肾小球疾病引起的一组临床综合征。其中肾脏病理类型表现为FSGS者临床治疗困难,预后差。该病属于中医"水肿"范畴。由于其病机复杂,常常迁延难愈。【目的】改善难
会议
随着人民生活水平的逐渐提高和医疗美容技术的成熟,医疗美容行业快速发展,医疗美容纠纷数量也随之增加。医疗美容是指运用药物、手术、医疗器械以及其他具有创伤性或者不可逆性的医学技术方法对人的容貌和人体各部位形态进行的修复与再塑的美容方式。医疗美容手术失败,一般都会对人身权益造成损害,甚至可能造成当事人精神上的极度痛苦,所以很多受害人都会主张精神损害赔偿。专门针对医疗美容侵权所造成的精神损害赔偿,目前相关
学习拖延主要指学生在学习活动中有意识地推迟规定时间内必须完成的学习任务,并伴有消极情绪体验的一种行为。小学高年级阶段是养成良好学习习惯、培养健全人格的黄金期,而学习拖延的行为在小学生群体中普遍存在,不仅影响着学生学业的发展,而且对身心健康造成了危害。为了解小学高年级学生学习拖延的现状及原因,对C市D小学的高年级学生的学习拖延进行了现状及原因的调查与研究。C市D小学是一所规模较大的县城小学,生源主要
近年来随着大数据、机器学习、5G等技术飞速发展,数据规模越来越大,数据量呈几何增长,数据来源和类型更加多元化。同时随着企业发展,新的业务线不断产生,根据不同业务线创建的数仓逐渐形成一个个封闭的数据中心,导致了数据多源异构的特点,这是企业目前面临的主要挑战。这些挑战为业务的长远发展带来很多问题,首先是数据的一致性与易用性问题,因为数据多源异构的特点,难以从多数据源中识别有效数据,数据的一致性也无法保
私募股权投资(PE)自20世纪八十年代引入我国,历经40多年的发展已经成为银行贷款、首次公开募股之外的第三大融资手段。近几年,我国经济增速放缓,社会存量资本减少,私募资金募集规模和投资收益出现下滑,为了促进私募股权投资的发展、构建多层级资本市场体系和寻找新的经济增长点,以科技创新型企业为主的科创板应运而生。科创板的设立,为私募股权投资提供了新的退出渠道,使其有机会分享到新兴产业增长带来的巨大红利,
全球经济是一个整体,经过40多年的改革开放,我国经济已深度融入全球产业链供应链。在受新冠肺炎疫情影响,全球产业链和供应链平稳有序运行受到了不同程度冲击的情况下,我国应