论文部分内容阅读
某眼镜连锁销售店在日常销售中应用连锁零售销售系统,积累了大量的销售数据,但该系统只支持极其简单的统计查询,无法进行商品关联性、销量和利润预测等分析。因此,本文对该企业原信息管理系统中多年积累的历史销售数据进行分析,挖掘出相关性高的商品组合进行套餐优惠推销,并在此基础上,预测一些商品和一些组合商品的销售利润和销量等,以制定促销计划提高企业利润。此外,在该眼镜企业新开发的信息管理系统基础上,集成了该数据分析系统,能够达到对新的销售数据进行实时分析。
论文主要工作如下:
(1)数据预处理。针对眼镜店原始数据表间关系不明确,没有主外键对应关系,表中某些销售记录项存在缺失和错误数据等,存在大量的销售价格、数量、金额等不完整,销售价格含有噪声,销售折扣不一致等情况。本文首先对这些原始销售数据进行数据选取,理清楚原始数据之间的关系,然后通过填写数据的值,纠正错误数据,消除冗余数据,并解决不一致等来“清洗”数据,最后将干净的数据进行规约集成,得到之后数据分析所需要的数据。
(2)关联规则挖掘。本部分主要目的是对销售商品之间的关联性进行关联规则挖掘。由于眼镜店的销售数据中每个销售单的商品种类比较少,每一个事务所含的项不多,很少有超过5个项的,并且顾客购买的商品组合有限,某些商品之间,根本不会组合在一起购买,如果采用传统Apriori算法挖掘,将产生大量无用的候选集,因此,本文应用了基于一次扫描的关联规则挖掘算法,每次扫描一个事务,并对该事务的所有可能的项集进行支持度计数,如果支持度计数超过预先设定的阈值,则将其插入到频繁项集数据库表中,提高了挖掘的速度。另一方面,针对大量的销售数据,采取分批次调入内存来进行商品的相关性挖掘处理,最后再合并挖掘结果。使企业得到商品组合销售情况,可以根据商品组合的频繁度高低,来进行合理销售安排。
(3)销售预测。在获得相关性较强的商品基础上,本文采用优化动态指数平滑模型,对商品和商品组合进行销售预测,根据用户输入的预测参数,如预测时间,预测要销售的商品或者拟组合销售的商品,来预测未来时间段要销售的商品和商品组合的销售量和利润,从而为企业的决策提供一定的支持。
(4)设计并实现了销售数据分析系统。该数据分析系统包含数据预处理模块、关联规则挖掘模块、销售分析模块和会话模块。其中,前三大模块实现了前面三部分内容,会话模块是用户与系统的交互平台,通过会话模块,用户可以输入挖掘或预测参数,并查询系统运行结果。该数据分析系统采用C#实现,并用SQL Server存储销售数据。其运行结果表明,应用本文的关联规则挖掘算法和动态指数平滑模型,能够较快的挖掘出商品的关联规则,较准确的预测出商品的销售数量和利润。