零售交易数据的购物篮挖掘与压缩方法研究

来源 :深圳大学 | 被引量 : 1次 | 上传用户:icerjack
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,我们时时刻刻都在产生着形形色色的数据,同时也在享受数据带给我们的各种服务与便利。在零售领域,现代连锁零售企业都有着海量的交易数据,对这些数据进行有效地挖掘可以帮助企业提升自己的科学管理水平。购物篮分析是数据挖掘技术在零售业的典型应用之一,旨在从零售记录中分析出顾客经常同时购买的商品的组合,挖掘出购物篮中有价值的信息。通过与零售客户的详细沟通与调研,发现传统购物篮分析在实际应用中存在诸多缺陷和不实用。首先,传统购物篮分析仅仅针对某一概念层次的商品,并不考虑这一层次中的商品之间的关系,这就导致传统的购物篮分析方法得出的结果通常是同一类商品的集合。其次,在传统的购物篮分析中,仅仅根据支持度这一维度来对购物篮进行评估,这样得出的购物篮普遍都是一些常规商品的组合,对企业的价值不大。最后,传统购物篮分析普遍面临一个问题就是支持度阀值的设置问题,阀值设置过低会产生数量庞大的购物篮,从而掩盖了真正有意义的购物篮;阀值设置过高会导致产生的购物篮数量过少且太过常规。本文针对上述传统购物篮分析中存在的问题,提出一种新的购物篮分析方法,完成了以下三个创新工作:1.根据交易数据生成商品层次结构树,得到商品之间的关系信息。在生成购物篮的过程中,利用商品层次结构树加入约束条件,使得同一个购物篮中不会出现属于相同父类的商品,增加了购物篮中商品的多样性,提升购物篮的实用价值。2.在传统购物篮分析中,通常以支持度作为评估购物篮重要性的唯一标准。本文在此基础之上加入了销售额的维度。这样得到的购物篮不仅具有普遍性,也具有更高价值,使得企业能够将关注点更多地聚焦在那些利润高的商品上,提高企业的利润率。3.针对支持度阀值设置过小导致的购物篮数量庞大的问题,本文提出了一种新的购物篮压缩方法。与以往的购物篮压缩方法不同的是,本文根据交易数据的特征与现实生活中购物篮的时间特性,对购物篮构造了具有时间序列特征的属性,然后以聚类的方式来找出一系列的代表购物篮,从而实现对购物篮集合的压缩。
其他文献
文章介绍了干部人事档案专项审核工作中发现的问题:干部档案材料不齐全;干部档案材料不规范;干部档案意识不强。分析了加强干部档案管理的对策:提高全民档案意识;做好干部档案材料
项目进度管理在近些年的项目开发和推进中发挥着越来越大的作用,项目进度管理在企业的项目推进中得到了越来越多的应用和推广。项目管理者通过采用科学的管理控制手段和应对
本文主要通过对城市公共性空间——街道的活力和功能进行分析,提出了重塑城市街道活力的几个原则包括:街道功能的复合化、合理的交通布局、足够的人流密度、适合的街道尺度以
关于国民党“片面抗战”,据笔者目前所看到的资料,其提法的刍形最早见于1937年8月,我党在洛川会议作出的《中央关于目前形势与党的任务的决定》,1937年10月25日,毛泽东“和
近年来,许多高校都越来越重视固定资产的管理创新模式,而固定资产清查则是资产管理中极为重要的工作环节。本文以某高校的固定资产清查开展工作为切入点,就高校开展固定资产
会展资源是会展业可持续发展的物质基础和会展产业对经济发展拉动作用的重要依托。本文从制定我国会展资源国家普查标准的角度出发,对如何制订相关的类别、标准,以及如何更好
本论文主要以铁路商贸企业A公司作为研究对象,运用企业战略管理模型及相关理论,对其经营策略做了较为深入的研究。近年来,受全球经济一体化进程加快、国内产能结构调整等宏观
本文总结了陈潮祖教授从气、津论治慢性便秘的经验。陈氏认为,慢性便秘多由热盛津伤(阴津亏损)、水津不布、传导无力或三焦气滞所致,而调畅气机,转输津液,是治疗慢性便秘最关
简单介绍铰接式转向架结构及运用铰接式转向架的有轨电车车辆总体布置和编组模式;针对铰接式转向架车辆的特殊形式,研究其车辆曲线加宽的计算方法,并以佛山高明有轨电车为例分析
随着我国"一带一路"等倡议的实施,国内建筑团队服务于异地建设项目的情景将越来越多。如何在项目的异地实施过程中提高各方的协同效率?是一个必须解决的问题。在面对建筑项目