论文部分内容阅读
如今,"网购"已成为人们生活的一部分。在购物的同时,人们的购物记录被保留在网站数据库内。网店老板经常关心的问题是顾客的购物习惯。他们想知道:"什么商品组或集合顾客会在一次购物时同时购买"。本论文通过"蘑菇街"购物网站一段时期所有顾客购买物品的清单和相应商品的利润,分析顾客购物习惯,制定促销方案,从而增加销量。问题的数据来源为"蘑菇街"购物网站。本论文旨在解决三个问题中,首先,根据给出的购买数据,建立一种数学模型来定量表达顾客在网购时采购的多种商品之间的关联密切程度,其次,寻找一种快速有效的方法分析出哪些商品是最频繁被同时购买的,最后,给出使得经营者受益最大的促销方案。在问题一中,参照Manhattan距离公式,定义参数λ反映不同商品间的密切程度,但考虑到原公式受"有顾客未同时选购这组商品"的影响过于巨大,参照Jaccard距离对公式进一步优化,得出求解密切程度的最优算法模型,并举例计算出几组相关商品的密切程度。在问题二中,我们从商品数量为2开始逐个递增,依次计算不同商品数量下所有组合的购买频率,每次计算都对结果进行筛选并作为下一次计算的参考数据。最后,我们定义优度系数这一概念,按优度系数对所有组合进行降序排序,并列举出最优的前20位组合方案。在问题三中,我们首先计算出每组商品组合的利润和,再用利润和与优度系数共同表示利润指标,以比较组合的预期获利大小。按照利润指标降序对所有筛选出的组合排序后,找出利润指标最大的若干商品组合,并由此设计相应的促销方案。以利润指数最高的商品组合:368号、529号商品为例,该组商品的利润指数高达189487.6,在所有商品组合中排首位,说明促销可能带来的利润最大,商家可以通过将其放在首页醒目处、加大宣传、组合减价销售等方法进行促销。