论文部分内容阅读
随着电子管理系统的高速发展,每天都有大量的商业经营数据产生,运用数据挖掘算法从这些经营数据中提取商业信息变得越来越有价值。 根据历史交易数据,将商品按照利润相关的某种指标进行优先级排名,即商品选择问题,这是商业以及一些其他领域的应用中一个基础问题。要解决它,难点在于商品的利润不仅包括其自身的利润,也需要考虑到该商品的销售对相关商品的影响,即“交叉销售作用”。Profset是解决商品选择问题的经典算法,然而该模型具有一系列缺陷,本文的研究在profset算法的基础上展开,主要工作如下: 基于假设检验,提出了新的商品间关联关系的判定指标,即有效项集的概念。基于商品间置信度的概念,重新定义了交易分解步骤,添加了项集退化步骤,这些做法修正了profset的缺陷,改进后的算法被命名为x-profset。 在一个真实数据集与一个人工合成数据集上进行了测试,实验表明,有效项集能够有效发掘有关联关系的商品。同时将新算法的商品选择结果与profset算法,以及一个单品利润优先选择的算法进行了对比。新算法的估计利润有2%-6%的提升。另外,新算法能够生成商品的自身利润与交叉销售利润权重,这对相关商业决策很有帮助。