论文部分内容阅读
摘 要 本文针对新零售目标产品的精准需求预测的问题,运用了相关性分析、灰色预测及神经网络等理论或方法,构建了灰色预测模型以及神经网络等模型,综合运用了MATLAB、PYCHARM、SPSS等软件编程求解,研究出了在不同因素影响下准确预测销售目标产品需求量。本文特色:灵活运用神经网络,SPSS相关性分析,用PSO粒子群算法优化了神经网络模型。
关键词 Pearson相关系数 Kendall秩相关系数 灰色预测模型 神经网络模型 PSO粒子群优化
中图分类号:F274 文献标识码:A 文章编号:1007-0745(2020)04-0001-14
针对问题一,要求解决:从产品特征,库存信息,节假日折扣等因素分析在2018年国庆,双十一,双十二和元旦四个节假日内对目标skc(销售时间处于2018年7月1日到2018年10月1日内累计销售额排名前50的skc)的销售量的影响。首先,运用了PYTHON进行数据预处理,运用SPSS进行相关性分析,得出了2018年国庆,双十一,双十二和元旦四个节假日内目标skc的销售量受元旦折后价,国庆折后价,双十一库存,双十二库存,国庆库存的影响。
针对问题二,要求解决:分析结果预测给定区域内目标小类(为历史销售时间处于2019年6月1日至2019年10月1日内且累2计销售额排名前10的小类)在2019年10月1日后3个月中每个月的销售量,给出每个月预测值的MAPE。
首先,运用了PYTHON进行数据预处理,运用灰色预测理论构建灰色预测模型,运用了MATLAB软件编程求解,得出了2019年10月1日后3个月中每个月的销售量预测值的MAPE为0.11,0.38,0.28。
针对问题三,要求解决:通过建立相关数学模型,在考虑小类预测结果和skc销售曲线与小类销售曲线之间的差异的同时,预测目标小类内所有skc在2019年10月1日后12周内每周的周销量,并给出每周预测值的MAPE。首先,运用了PYTHON进行数据预处理,运用神经网络理论进行构建bp神经网络模型,考虑到bp神经网络模型在数据量较大的情况下会出现局部解较小的情况,采用PSO粒子群算法优化bp神经网络的权值和阈值以此抵消这类情况,再运用了MATLAB软件编程求解,得出了2019年10月1日后12周内每周的周销量预测值的MAPE为0.11,0.14,0.2,0.21,0.15,0.31,0.22,0.36,0.39,0.4,0.29,0.33。
本文最后还对模型进行了误差分析,对模型的优缺点进行了客观的评价,基于灰色预测和bp神经网络对存在的不足进行了改进,对模型进行了横向和纵向推广。
1 问题的重述
1.1 背景知识
1.1.1 引言部分
随着我国消费市场的不断发展,市场上的消费模式已经逐步由“以物为主”转变为“以客为主”。在新零售行业,性价比不再是顾客衡量是否购买物品的唯一标准,人们的需求也不仅仅是单一的追求实用性,而是更多的考虑时尚性,把注意力放在“个性化、时尚、美观”等方面。在这类特殊需求的推动下,新零售企业的生产模式逐步向多品种、小批量迈进,这让商场内零售店铺里的饰品和玩具等种类变得更加琳琅满目,同时也给零售行业的库存管理增加了很大的难度。如何根据层级复杂,品类繁多的历史销售数据,以区域层级,小类层级乃至门店 skc(单款单色)层级给出精准的需求预测,是当前大多数新零售企业需要重点关注并思考的问题。
1.1.2 任务定价
随着中国经济不断发展,居民收入不断提升,基础消费品已经无法满足高素质消费者日益变化的消费需求。零售企业运营先进技术,通过线上线下和物流的结合促进零售行业转型升级。使得居民消费朝着便捷化、个性化、人文化、体验化、多样化的方向发展。同时也为零售行业提供了新的发展契机,然而我们仍需注意新零售发展过程中所产生的些许问题,以期零售行业的进一步发展。
1.1.3 研究意义
在“新零售”模式下,消费者可以任意畅游在智能、高效、快捷、平价、愉悦的购物环境之中,购物体验获得大幅提升,年轻群体对消费升级的强烈意愿也由此得到较好满足。新零售的出现推动了商业要素的重构,加速了零售经营模式和商业模式的创新,或将引发零售行业的巨大变革。
1.2 相关数据
1.销售流水数据。
2.产品信息表。
3.区域库存数据。
4.节假日信息表。
1.3 具体问题
1.3.1 问题一
从产品特征,库存信息,节假日折扣等因素分析在2018年国庆,双十一,双十二和元旦四个节假日内对目标skc(销售时间处于2018年7月1日到2018年10月1日内累计销售额排名前50的skc)的销售量的影响。
1.3.2 问题二
结合分析结果预测给定区域内目标小类(为历史销售时间处于2019年6月1日至2019年10月1日内且累2计销售額排名前10的小类)在2019年10月1日后3个月中每个月的销售量,给出每个月预测值的MAPE。
1.3.3 问题三
通过建立相关数学模型,在考虑小类预测结果和skc销售曲线与小类销售曲线之间的差异的同时,预测目标小类内所有skc在2019年10月1日后12周内每周的周销量,并给出每周预测值的MAPE。
1.3.4 问题四
给企业写一封推荐信,向企业推荐预测结果和方法,并说明方案的合理性以及后续优化方向。
2 问题的分析
2.1 研究现状综述
2016年11月11日,国务院办公厅印发《关于推动实体零售创新转型的意见》(国办发(2016)78 号),明确了推动我国实体零售创新转型的指导思想和基本原则。同时,在调整商业结构、创新发展方式、促进跨界融合、优化发展环境、强化政策支持等方面作出具体部署。《意见》在促进线上线下融合的问题上强调:“建立适应融合发展的标准规范、竞争规则,引导实体零售企业逐步提高信息化水平,将线下物流、服务、体验等优势与线上商流、资金流、信息流融合,拓展智能化、网络化的全渠道布局。”[1] 虽然线上零售一段时期以来替代了传统零售的功能,但从两大电商平台,天猫和京东的获客成本可以看出,电商的线上流量红利见顶;与此同时线下边际获客成本几乎不变,且实体零售进入整改关键期,因此导致的线下渠道价值正面临重估[2]。
移动支付等新技术开拓了线下场景智能终端的普及,以及由此带来的移动支付、大数据、虚拟现实等技术革新,进一步开拓了线下场景和消费社交,让消费不再受时间和空间制约。
新中产阶级崛起的80和90后、接受过高等教育、追求自我提升,逐渐成为社会的中流砥柱[3]。
2.2 对问题的总体分析和解题思路
本文是针对新销售目标产品做出精准需求预测,我们先从给出的数据中运用PYTHON软件通过附录中的代码筛选出所需要的数据,再结合数据比较各种因素对需求量不同的影响,在分析问题后选用神经网络的方法来进一步处理数据从而得出各种因素对需求量的影响,选用双变量关联分析法、rbf神经网络、bp神经网络和pso粒子群优化算法等方法对各项数据做出最理想化的处理从而对新销售目标产品做出精准需求预测。
2.3 对具体问题的分析和对策
2.3.1 对问题一的分析和对策
问题一要求分析相应节假日内各类因素对目标skc的销量影响,针对这个问题我们分为两个步骤来解决。首先我们对附件的数据进行预处理,PYCHARM软件对附件中的数据进行筛选分析,其次我们选取合适的会影响需求的因素,分别为标签价、实际售价、节假日时长、销售特征、库存信息以及节假日折扣等因素,进行双变量关联分析法,得出更精确的数据和各类因素的影响力,再用题中给出的MAPE来检测结果的合理性,最后对数据做出简单小结。
2.3.2 对问题二的分析和对策
问题二要求预测给定区域内目标小类在该时间段内每个月的销售量并给出每个月预测值的MAPE。针对这个问题我们分两个步骤来解决。首先我们对附件的数据进行预处理,通过PYCHARM软件用pandas库筛选数据进行分析,得到能达到预测目的的相关参数的数据。在此基础上通过MATLAB软件用灰色预测再对筛选出来的数据进行拟合、规整。再用题中给出的MAPE来检测结果的合理性,最后总体分析预测结果误差大小。
2.3.3 对问题三的分析和对策
问题三要求建立相关数学模型,并考虑小类预测结果的同时,预测目标小类所有skc在特定时间后数周内的周销量并给出预测值的MAPE。针对这个问题我们分两个步骤来解决。首先我们对附件进行数据预处理,通过PYCHARM软件用pandas库筛选数据进一步来分析,得到能够预测的相关因素数据。运用神经网络理论进行构建bp神经网络模型,考虑到bp神经网络模型在数据量较大的情况下会出现局部解较小的情况,采用PSO粒子群算法优化bp神经网络的权值和阈值以此抵消这类情况,再运用了MATLAB软件编程求解,进一步的处理从而预测出周销量,再用题中给出的MAPE来检测结果的合理性,最后做出小结。
2.3.4 对问题四的分析和对策
问题四是要求面向企业来推荐自己的预测结果和方法,并说明合理性和后续优化方向,并且是信件的格式。针对这一问题结合前三个问题得出的预测结果和方法,通过推荐信格式来阐述自己得出的预测结果和方法,并根据预测结果来推测方案的合理性,结合方案的优缺点找准待优化方面作出后续的优化设计。
3 模型的假设
1.假设国庆、双十一、双十二、元旦四个节假日内销量的影响有销售特征,商品特征,标签价格,库存信息,节假日折扣,节假日时长等。
2.假设在预测时间段内人们消费力度与给定时间内消费力度相同。
3.假设每年对应月份的销售趋势不变。
4.假设销售不受突发情况的影响。
4 模型的建立与求解
4.1 问题一的分析與求解
4.1.1 对问题的分析
问题一要求分析相应节假日内各类因素对目标skc的销量影响,针对这个问题我们分为两个步骤来解决。首先我们对附件的数据进行挖掘,使用PYCHARM软件对附件中的数据进行筛选分析,其次我们选取合适的会影响需求的因素,分别为标签价、实际售价、节假日时长、销售特征、库存信息以及节假日折扣等因素,进行双变量关联分析法(Pearson相关系数和Kendall秩相关系数),得出更精确的数据和各类因素的影响力,再用题中给出的MAPE来检测结果的合理性,最后对数据做出简单小结。
定义1 双变量关联分析法:两个变量之间的相关关系可以通过计算变量间的相关系数,来衡量它们之间相关关系的强弱,不用类型的变量,SPSS应用不同的相关系数来判定。两个定距或定比变量,用Pearson相关系数;两个定序或定类变量,用Spearman等级相关系数和Kendall秩相关系数。
定义2 Pearson相关系数:相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式。
简单相关系数:又叫相关系数或线性相关系数,一般用字母r 表示,用来度量两个变量间的线性关系。定义式
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。
复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。例如,某种商品的季节性需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。
典型相关系数:是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。
定义3 Kendall秩相关系数:Kendall(肯德尔)系数的定义:n个同类的统计对象按特定属性排序,其他属性通常是乱序的。同序对(concordant pairs)和异序对(discordant pairs)之差与总对数(n*(n-1)/2)的比值定义为Kendall(肯德尔)系数。 4.1.2 對问题的求解
问题一要求我们分析2018年国庆节,双十一,双十二和元旦这四个节假日内各种相关因素对目标skc的销售量的影响。首先根据数据所给的信息,将这四个节日的产品信息进行数据处理。得到了库存,商品价格,销量,销售额,商品折扣这五种数据。然后采用双关联分析可能影响销售量的因素进行了分析,通过对皮尔逊相关系数的大小对因素进行了筛选,选取了几个相关性较大的因素。
数据预处理过后的数据如表1所示:
通过SPSS相关性分析得出如表2-5所示结果:
通过对销售量相关系数的比较,结合四个节日中影响因素的相关分析得出元旦折后价,国庆折后价,双十一库存,双十二库存,国庆库存与销量影响较大且呈正相关。
4.2 问题二的分析与求解
4.2.1 对问题的分析
问题二要求预测给定区域内目标小类在该时间段内每个月的销售量并给出每个月预测值的MAPE。针对这个问题我们分两个步骤来解决。首先我们对附件的数据进行挖掘,通过PYCHARM软件用pandas库筛选数据进行分析,得到能达到预测目的的相关参数的数据。在此基础上通过MATLAB软件用灰色预测再对筛选出来的数据进行拟合、规整。再用题中给出的MAPE来检测结果的合理性,最后总体分析预测结果误差大小。
定义1[4]灰色预测模型:
(1)灰色系统、白色系统和黑色系统
白色系统是指一个系统的内部特征是完全已知的,既系统信息是完全充分的。黑色系统是一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。灰色系统介于白色和黑色之间,灰色系统内的一部分信息是已知的,另一部分信息是未知的,系统内各因素间有不确定的关系。
(2)灰色预测法
灰色预测法是一种预测灰色系统的预测方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。
(3)精度检验等级参照表
灰色生成数列:灰色系统理论认为,尽管客观表象复杂,但总是有整体功能的,因此必然蕴含某种内在规律。关键在于如何选择适当的方式去挖掘和利用它。灰色系统是通过对原始数据的整理来寻求其变化规律的,这是一种就数据寻求数据的现实规律的途径,也就是灰色序列的生产。一切灰色序列都能通过某种生成弱化其随机性,显现其规律性。数据生成的常用方式有累加生成、累减生成和加权累加生成。
由此得到的数列称为邻值生成数,权α也称为生成系数。 特别地,当生成系数α=0.5时,则称该数列为均值生成数,也称为等权邻值生成数。
累加生成的特点:一般经济数列都是非负数列。累加生成能使任意非负数列、摆动的与非摆动的,转化为非减的、递增的。
灰色模型GM(1,1):灰色系统理论是基于关联空间、光滑离散函数等概念定义灰导数与灰微分方程,进而用离散数据列建立微分方程形式的动态模型,即灰色模型是利用离散随机数经过生成变为随机性被显著削弱而且较有规律的生成数,建立起的微分方程形式的模型,这样便于对其变化过程进行研究和描述。
那么现在的问题就是求a和b的值,我们可以用一元线性回归,也就是最小二乘法求它们的估计值为:
GM(1,1)的白化型:
对于GM (1, 1)的灰微分方程,如果将时刻k=2.3...n视为连续变量t,则之前的x(1)视为时间t函数,于是灰导数x(0)(k)变为连续函数的导数,白化背景值z(1)(k)对应于导数x(1)(t)。于是GM (1, 1)的灰微分方程对应于的白微分方程为:
GM(1,1)灰色预测的步骤:
数据的检验与处理:为了保证GM(1,1)建模方法的可行性,需要对已知数据做必要的检验处理。设原始数据列为x(0)=(x0(1),x0(2),….x0(n))x(0)=(x0(1),x0(2),….x0(n)),计算数列的级比:
如果所有的级比都落在可容覆盖区间内,则数列x(0)可以建立GM (1, 1)模型且可以进行灰色预测。否则,对数据做适当的变换处理,如平移变换:
取c使得数据列的级比都落在可容覆盖内。
检验预测值
(1)残差检验:计算相对残差
如果对所有的|ε(k)|
关键词 Pearson相关系数 Kendall秩相关系数 灰色预测模型 神经网络模型 PSO粒子群优化
中图分类号:F274 文献标识码:A 文章编号:1007-0745(2020)04-0001-14
针对问题一,要求解决:从产品特征,库存信息,节假日折扣等因素分析在2018年国庆,双十一,双十二和元旦四个节假日内对目标skc(销售时间处于2018年7月1日到2018年10月1日内累计销售额排名前50的skc)的销售量的影响。首先,运用了PYTHON进行数据预处理,运用SPSS进行相关性分析,得出了2018年国庆,双十一,双十二和元旦四个节假日内目标skc的销售量受元旦折后价,国庆折后价,双十一库存,双十二库存,国庆库存的影响。
针对问题二,要求解决:分析结果预测给定区域内目标小类(为历史销售时间处于2019年6月1日至2019年10月1日内且累2计销售额排名前10的小类)在2019年10月1日后3个月中每个月的销售量,给出每个月预测值的MAPE。
首先,运用了PYTHON进行数据预处理,运用灰色预测理论构建灰色预测模型,运用了MATLAB软件编程求解,得出了2019年10月1日后3个月中每个月的销售量预测值的MAPE为0.11,0.38,0.28。
针对问题三,要求解决:通过建立相关数学模型,在考虑小类预测结果和skc销售曲线与小类销售曲线之间的差异的同时,预测目标小类内所有skc在2019年10月1日后12周内每周的周销量,并给出每周预测值的MAPE。首先,运用了PYTHON进行数据预处理,运用神经网络理论进行构建bp神经网络模型,考虑到bp神经网络模型在数据量较大的情况下会出现局部解较小的情况,采用PSO粒子群算法优化bp神经网络的权值和阈值以此抵消这类情况,再运用了MATLAB软件编程求解,得出了2019年10月1日后12周内每周的周销量预测值的MAPE为0.11,0.14,0.2,0.21,0.15,0.31,0.22,0.36,0.39,0.4,0.29,0.33。
本文最后还对模型进行了误差分析,对模型的优缺点进行了客观的评价,基于灰色预测和bp神经网络对存在的不足进行了改进,对模型进行了横向和纵向推广。
1 问题的重述
1.1 背景知识
1.1.1 引言部分
随着我国消费市场的不断发展,市场上的消费模式已经逐步由“以物为主”转变为“以客为主”。在新零售行业,性价比不再是顾客衡量是否购买物品的唯一标准,人们的需求也不仅仅是单一的追求实用性,而是更多的考虑时尚性,把注意力放在“个性化、时尚、美观”等方面。在这类特殊需求的推动下,新零售企业的生产模式逐步向多品种、小批量迈进,这让商场内零售店铺里的饰品和玩具等种类变得更加琳琅满目,同时也给零售行业的库存管理增加了很大的难度。如何根据层级复杂,品类繁多的历史销售数据,以区域层级,小类层级乃至门店 skc(单款单色)层级给出精准的需求预测,是当前大多数新零售企业需要重点关注并思考的问题。
1.1.2 任务定价
随着中国经济不断发展,居民收入不断提升,基础消费品已经无法满足高素质消费者日益变化的消费需求。零售企业运营先进技术,通过线上线下和物流的结合促进零售行业转型升级。使得居民消费朝着便捷化、个性化、人文化、体验化、多样化的方向发展。同时也为零售行业提供了新的发展契机,然而我们仍需注意新零售发展过程中所产生的些许问题,以期零售行业的进一步发展。
1.1.3 研究意义
在“新零售”模式下,消费者可以任意畅游在智能、高效、快捷、平价、愉悦的购物环境之中,购物体验获得大幅提升,年轻群体对消费升级的强烈意愿也由此得到较好满足。新零售的出现推动了商业要素的重构,加速了零售经营模式和商业模式的创新,或将引发零售行业的巨大变革。
1.2 相关数据
1.销售流水数据。
2.产品信息表。
3.区域库存数据。
4.节假日信息表。
1.3 具体问题
1.3.1 问题一
从产品特征,库存信息,节假日折扣等因素分析在2018年国庆,双十一,双十二和元旦四个节假日内对目标skc(销售时间处于2018年7月1日到2018年10月1日内累计销售额排名前50的skc)的销售量的影响。
1.3.2 问题二
结合分析结果预测给定区域内目标小类(为历史销售时间处于2019年6月1日至2019年10月1日内且累2计销售額排名前10的小类)在2019年10月1日后3个月中每个月的销售量,给出每个月预测值的MAPE。
1.3.3 问题三
通过建立相关数学模型,在考虑小类预测结果和skc销售曲线与小类销售曲线之间的差异的同时,预测目标小类内所有skc在2019年10月1日后12周内每周的周销量,并给出每周预测值的MAPE。
1.3.4 问题四
给企业写一封推荐信,向企业推荐预测结果和方法,并说明方案的合理性以及后续优化方向。
2 问题的分析
2.1 研究现状综述
2016年11月11日,国务院办公厅印发《关于推动实体零售创新转型的意见》(国办发(2016)78 号),明确了推动我国实体零售创新转型的指导思想和基本原则。同时,在调整商业结构、创新发展方式、促进跨界融合、优化发展环境、强化政策支持等方面作出具体部署。《意见》在促进线上线下融合的问题上强调:“建立适应融合发展的标准规范、竞争规则,引导实体零售企业逐步提高信息化水平,将线下物流、服务、体验等优势与线上商流、资金流、信息流融合,拓展智能化、网络化的全渠道布局。”[1] 虽然线上零售一段时期以来替代了传统零售的功能,但从两大电商平台,天猫和京东的获客成本可以看出,电商的线上流量红利见顶;与此同时线下边际获客成本几乎不变,且实体零售进入整改关键期,因此导致的线下渠道价值正面临重估[2]。
移动支付等新技术开拓了线下场景智能终端的普及,以及由此带来的移动支付、大数据、虚拟现实等技术革新,进一步开拓了线下场景和消费社交,让消费不再受时间和空间制约。
新中产阶级崛起的80和90后、接受过高等教育、追求自我提升,逐渐成为社会的中流砥柱[3]。
2.2 对问题的总体分析和解题思路
本文是针对新销售目标产品做出精准需求预测,我们先从给出的数据中运用PYTHON软件通过附录中的代码筛选出所需要的数据,再结合数据比较各种因素对需求量不同的影响,在分析问题后选用神经网络的方法来进一步处理数据从而得出各种因素对需求量的影响,选用双变量关联分析法、rbf神经网络、bp神经网络和pso粒子群优化算法等方法对各项数据做出最理想化的处理从而对新销售目标产品做出精准需求预测。
2.3 对具体问题的分析和对策
2.3.1 对问题一的分析和对策
问题一要求分析相应节假日内各类因素对目标skc的销量影响,针对这个问题我们分为两个步骤来解决。首先我们对附件的数据进行预处理,PYCHARM软件对附件中的数据进行筛选分析,其次我们选取合适的会影响需求的因素,分别为标签价、实际售价、节假日时长、销售特征、库存信息以及节假日折扣等因素,进行双变量关联分析法,得出更精确的数据和各类因素的影响力,再用题中给出的MAPE来检测结果的合理性,最后对数据做出简单小结。
2.3.2 对问题二的分析和对策
问题二要求预测给定区域内目标小类在该时间段内每个月的销售量并给出每个月预测值的MAPE。针对这个问题我们分两个步骤来解决。首先我们对附件的数据进行预处理,通过PYCHARM软件用pandas库筛选数据进行分析,得到能达到预测目的的相关参数的数据。在此基础上通过MATLAB软件用灰色预测再对筛选出来的数据进行拟合、规整。再用题中给出的MAPE来检测结果的合理性,最后总体分析预测结果误差大小。
2.3.3 对问题三的分析和对策
问题三要求建立相关数学模型,并考虑小类预测结果的同时,预测目标小类所有skc在特定时间后数周内的周销量并给出预测值的MAPE。针对这个问题我们分两个步骤来解决。首先我们对附件进行数据预处理,通过PYCHARM软件用pandas库筛选数据进一步来分析,得到能够预测的相关因素数据。运用神经网络理论进行构建bp神经网络模型,考虑到bp神经网络模型在数据量较大的情况下会出现局部解较小的情况,采用PSO粒子群算法优化bp神经网络的权值和阈值以此抵消这类情况,再运用了MATLAB软件编程求解,进一步的处理从而预测出周销量,再用题中给出的MAPE来检测结果的合理性,最后做出小结。
2.3.4 对问题四的分析和对策
问题四是要求面向企业来推荐自己的预测结果和方法,并说明合理性和后续优化方向,并且是信件的格式。针对这一问题结合前三个问题得出的预测结果和方法,通过推荐信格式来阐述自己得出的预测结果和方法,并根据预测结果来推测方案的合理性,结合方案的优缺点找准待优化方面作出后续的优化设计。
3 模型的假设
1.假设国庆、双十一、双十二、元旦四个节假日内销量的影响有销售特征,商品特征,标签价格,库存信息,节假日折扣,节假日时长等。
2.假设在预测时间段内人们消费力度与给定时间内消费力度相同。
3.假设每年对应月份的销售趋势不变。
4.假设销售不受突发情况的影响。
4 模型的建立与求解
4.1 问题一的分析與求解
4.1.1 对问题的分析
问题一要求分析相应节假日内各类因素对目标skc的销量影响,针对这个问题我们分为两个步骤来解决。首先我们对附件的数据进行挖掘,使用PYCHARM软件对附件中的数据进行筛选分析,其次我们选取合适的会影响需求的因素,分别为标签价、实际售价、节假日时长、销售特征、库存信息以及节假日折扣等因素,进行双变量关联分析法(Pearson相关系数和Kendall秩相关系数),得出更精确的数据和各类因素的影响力,再用题中给出的MAPE来检测结果的合理性,最后对数据做出简单小结。
定义1 双变量关联分析法:两个变量之间的相关关系可以通过计算变量间的相关系数,来衡量它们之间相关关系的强弱,不用类型的变量,SPSS应用不同的相关系数来判定。两个定距或定比变量,用Pearson相关系数;两个定序或定类变量,用Spearman等级相关系数和Kendall秩相关系数。
定义2 Pearson相关系数:相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式。
简单相关系数:又叫相关系数或线性相关系数,一般用字母r 表示,用来度量两个变量间的线性关系。定义式
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。
复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。例如,某种商品的季节性需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。
典型相关系数:是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。
定义3 Kendall秩相关系数:Kendall(肯德尔)系数的定义:n个同类的统计对象按特定属性排序,其他属性通常是乱序的。同序对(concordant pairs)和异序对(discordant pairs)之差与总对数(n*(n-1)/2)的比值定义为Kendall(肯德尔)系数。 4.1.2 對问题的求解
问题一要求我们分析2018年国庆节,双十一,双十二和元旦这四个节假日内各种相关因素对目标skc的销售量的影响。首先根据数据所给的信息,将这四个节日的产品信息进行数据处理。得到了库存,商品价格,销量,销售额,商品折扣这五种数据。然后采用双关联分析可能影响销售量的因素进行了分析,通过对皮尔逊相关系数的大小对因素进行了筛选,选取了几个相关性较大的因素。
数据预处理过后的数据如表1所示:
通过SPSS相关性分析得出如表2-5所示结果:
通过对销售量相关系数的比较,结合四个节日中影响因素的相关分析得出元旦折后价,国庆折后价,双十一库存,双十二库存,国庆库存与销量影响较大且呈正相关。
4.2 问题二的分析与求解
4.2.1 对问题的分析
问题二要求预测给定区域内目标小类在该时间段内每个月的销售量并给出每个月预测值的MAPE。针对这个问题我们分两个步骤来解决。首先我们对附件的数据进行挖掘,通过PYCHARM软件用pandas库筛选数据进行分析,得到能达到预测目的的相关参数的数据。在此基础上通过MATLAB软件用灰色预测再对筛选出来的数据进行拟合、规整。再用题中给出的MAPE来检测结果的合理性,最后总体分析预测结果误差大小。
定义1[4]灰色预测模型:
(1)灰色系统、白色系统和黑色系统
白色系统是指一个系统的内部特征是完全已知的,既系统信息是完全充分的。黑色系统是一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。灰色系统介于白色和黑色之间,灰色系统内的一部分信息是已知的,另一部分信息是未知的,系统内各因素间有不确定的关系。
(2)灰色预测法
灰色预测法是一种预测灰色系统的预测方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。
(3)精度检验等级参照表
灰色生成数列:灰色系统理论认为,尽管客观表象复杂,但总是有整体功能的,因此必然蕴含某种内在规律。关键在于如何选择适当的方式去挖掘和利用它。灰色系统是通过对原始数据的整理来寻求其变化规律的,这是一种就数据寻求数据的现实规律的途径,也就是灰色序列的生产。一切灰色序列都能通过某种生成弱化其随机性,显现其规律性。数据生成的常用方式有累加生成、累减生成和加权累加生成。
由此得到的数列称为邻值生成数,权α也称为生成系数。 特别地,当生成系数α=0.5时,则称该数列为均值生成数,也称为等权邻值生成数。
累加生成的特点:一般经济数列都是非负数列。累加生成能使任意非负数列、摆动的与非摆动的,转化为非减的、递增的。
灰色模型GM(1,1):灰色系统理论是基于关联空间、光滑离散函数等概念定义灰导数与灰微分方程,进而用离散数据列建立微分方程形式的动态模型,即灰色模型是利用离散随机数经过生成变为随机性被显著削弱而且较有规律的生成数,建立起的微分方程形式的模型,这样便于对其变化过程进行研究和描述。
那么现在的问题就是求a和b的值,我们可以用一元线性回归,也就是最小二乘法求它们的估计值为:
GM(1,1)的白化型:
对于GM (1, 1)的灰微分方程,如果将时刻k=2.3...n视为连续变量t,则之前的x(1)视为时间t函数,于是灰导数x(0)(k)变为连续函数的导数,白化背景值z(1)(k)对应于导数x(1)(t)。于是GM (1, 1)的灰微分方程对应于的白微分方程为:
GM(1,1)灰色预测的步骤:
数据的检验与处理:为了保证GM(1,1)建模方法的可行性,需要对已知数据做必要的检验处理。设原始数据列为x(0)=(x0(1),x0(2),….x0(n))x(0)=(x0(1),x0(2),….x0(n)),计算数列的级比:
如果所有的级比都落在可容覆盖区间内,则数列x(0)可以建立GM (1, 1)模型且可以进行灰色预测。否则,对数据做适当的变换处理,如平移变换:
取c使得数据列的级比都落在可容覆盖内。
检验预测值
(1)残差检验:计算相对残差
如果对所有的|ε(k)|