论文部分内容阅读
随着经济水平的高速增长,目前国内品牌连锁超市的经营规模也不断扩大,超市行业在经营管理方面也越来越具科学化。现代连锁超市在日常经营中普遍都积累了海量的业务数据,然而这些数据却没有得到经营者的充分利用,使得其中隐含的有价值的商业信息被忽略。因此,如何有效的利用这些业务数据,如何在海量业务数据中发现有价值知识对现代超市有至关重要的意义。一家超市不仅要面对周边地区其他品牌大小超市的直接竞争,同时还面临着来自线上零售这个新型零售模型的挑战。如何采用合适的数据挖掘技术分析业务数据,发现商业规律、创造经济价值是现代超市关注的核心问题。关联规则是属于数据挖掘领域的一个重要技术,关联规则挖掘技术的应用领域非常广泛,在超市行业中也已经有了一定的研究和应用,通过关联规则挖掘可以发现业务数据中的隐藏规律,辅助经营者决策商品摆放和商品促销策略等问题。本文首先详细介绍了数据挖掘技术的相关理论;分析了超市行业的行业特点,列举了零售业中的常用的数据挖掘技术以及挖掘过程。然后详细阐述了数据预处理技术,说明了数据预处理技术的必要性、常用的数据预处理方法;接着对关联规则及其经典Apriori算法进行了深入的分析和研究,对关联规则做了全面的分类和总结;介绍了 Apriori算法思想,通过算法示例分析了 Apriori算法的性能问题,研究了多种Apriori算法的改进办法。在此基础上,针对Apriori算法的主要瓶颈问题,提出了基于布尔矩阵的改进算法。改进的算法主要从压缩矩阵、优化频繁项集的生成等方面来减少循环迭代,提高算法性能。此外,针对传统的关联规则评价模型“支持度—置信度”存在的问题,加入新的评价标准,来优化对挖掘结果的筛选。最后,以本地一家中型连锁超市的实际交易数据为基础,结合本文介绍的相关理论知识,使用Apriori算法和改进的算法为技术载体,采用“支持度—置信度—相关兴趣度”作为评价标准,开发了一个小型实践系统,通过实践系统进行数据挖掘、发现关联规则。评价挖掘结果,找出商品间有价值的关联信息,为超市在货架分布、商品陈列、交叉销售和商品促销等方面提供经营决策辅助。