销售数据分析系统的研究与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:wang840911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
某眼镜连锁销售店在日常销售中应用连锁零售销售系统,积累了大量的销售数据,但该系统只支持极其简单的统计查询,无法进行商品关联性、销量和利润预测等分析。因此,本文对该企业原信息管理系统中多年积累的历史销售数据进行分析,挖掘出相关性高的商品组合进行套餐优惠推销,并在此基础上,预测一些商品和一些组合商品的销售利润和销量等,以制定促销计划提高企业利润。此外,在该眼镜企业新开发的信息管理系统基础上,集成了该数据分析系统,能够达到对新的销售数据进行实时分析。   论文主要工作如下:   (1)数据预处理。针对眼镜店原始数据表间关系不明确,没有主外键对应关系,表中某些销售记录项存在缺失和错误数据等,存在大量的销售价格、数量、金额等不完整,销售价格含有噪声,销售折扣不一致等情况。本文首先对这些原始销售数据进行数据选取,理清楚原始数据之间的关系,然后通过填写数据的值,纠正错误数据,消除冗余数据,并解决不一致等来“清洗”数据,最后将干净的数据进行规约集成,得到之后数据分析所需要的数据。   (2)关联规则挖掘。本部分主要目的是对销售商品之间的关联性进行关联规则挖掘。由于眼镜店的销售数据中每个销售单的商品种类比较少,每一个事务所含的项不多,很少有超过5个项的,并且顾客购买的商品组合有限,某些商品之间,根本不会组合在一起购买,如果采用传统Apriori算法挖掘,将产生大量无用的候选集,因此,本文应用了基于一次扫描的关联规则挖掘算法,每次扫描一个事务,并对该事务的所有可能的项集进行支持度计数,如果支持度计数超过预先设定的阈值,则将其插入到频繁项集数据库表中,提高了挖掘的速度。另一方面,针对大量的销售数据,采取分批次调入内存来进行商品的相关性挖掘处理,最后再合并挖掘结果。使企业得到商品组合销售情况,可以根据商品组合的频繁度高低,来进行合理销售安排。   (3)销售预测。在获得相关性较强的商品基础上,本文采用优化动态指数平滑模型,对商品和商品组合进行销售预测,根据用户输入的预测参数,如预测时间,预测要销售的商品或者拟组合销售的商品,来预测未来时间段要销售的商品和商品组合的销售量和利润,从而为企业的决策提供一定的支持。   (4)设计并实现了销售数据分析系统。该数据分析系统包含数据预处理模块、关联规则挖掘模块、销售分析模块和会话模块。其中,前三大模块实现了前面三部分内容,会话模块是用户与系统的交互平台,通过会话模块,用户可以输入挖掘或预测参数,并查询系统运行结果。该数据分析系统采用C#实现,并用SQL Server存储销售数据。其运行结果表明,应用本文的关联规则挖掘算法和动态指数平滑模型,能够较快的挖掘出商品的关联规则,较准确的预测出商品的销售数量和利润。
其他文献
足球赔率是博彩公司根据其利用几年乃至数十年所积累的大量的、丰富的与足球比赛相关的各种数据数据,利用科学的、严谨的数学理论以及投注人心理研究等模型,通过计算得出的对于
无线传感器网络以其低耗自组、容错性好、易于大规模部署等优点,被广泛应用于军事、环境、工业和农业监控等领域。在无线传感器网络的应用中,节点的位置信息起到至关重要的作
随着科技的发展,视频图像的应用越来越广泛,视频图像中运动目标的分割是所有数字图像处理的重要环节,也是后续高级处理的基础,因此有关运动目标分割的研究就显得十分必要。运动目
随着Internet技术的飞速发展,隐藏在Web后台数据库中的信息资源因为其数据量大、结构完整受到了广泛关注,这些信息资源通常是由用户在Web查询页面提交查询请求后,以HTML页面
随着无线传感器网络(Wireless Sensor Network,WSN)在多领域的深入应用,WSN的重要性和前景变得越来越明确。WSN节点有限的运算能力和有限的能量等问题,吸引了来自不同学科的科研
随着Internet的迅速发展与普及,网络上出现了越来越多的主观性言论。对于这些主观性文本的分析和挖掘,传统的基于主题的文本分类方法已经无法满足需求。因此,人们开始关注并
指纹识别算法是目前高效、应用广泛的识别算法之一,是生物特征识别领域的研究热点之一。在公安、金融电子商务、政务、司法等领域有着广泛的应用。指纹识别具稳定性,唯一性,安全
随着计算机和通信技术的迅猛发展,网络也正朝着大规模、高度分布式的方向发展,同时计算机系统及其网络的被入侵行为也朝着规模化、分布化、复杂化等方向演化。由于各种网络安
车牌识别系统、(License Plate Recognition System,LPRS)是智能交通系统(Intelligent Transport System,ITS)一个重要组成部分。随着我国经济的飞速发展,汽车的总量也大幅度
k-近邻(KNN)算法是一种简单而有效的分类算法。传统的KNN分类算法存在着参数k难以确定以及分类新数据时间耗费大的两个缺陷。kNN模型算法(简记KNNModel)是一种基于KNN原理的