论文部分内容阅读
在瞬息万变的市场环境中,企业越来越强烈地感觉到客户资源将是企业获胜最重要的资源之一,企业已经从以产品为中心的模式向以客户为中心的模式转移。随着企业的不断发展和壮大,企业积累的客户也越来越多,但真正能为企业创造价值的客户却是有限的,所以企业必须对客户进行细分,针对不同的客户群制定不同的营销策略来提高客户的价值贡献。数据挖掘聚类技术能有效的将具有相同特征的客户聚为一类,为企业进行客户细分提供了技术支持。本论文对数据挖掘中的聚类技术以及聚类技术在客户细分中的应用做了研究与分析,主要研究工作和创新如下:(1)研究了数据挖掘的聚类算法。对基于划分的K-means算法、基于密度的DBSCAN算法及基于网格聚类的网格划分技术进行了分析,详细阐述了K-means算法存在的缺陷。K-means算法聚类结果依赖初始聚类中心值,而K-means算法对初始聚类中心的选取是随机的,所以不能保证聚类结果的精度;K-means算法在聚类中对“噪声”和孤立点也非常敏感,少量的“噪声”点就会让聚类结果产生较大的偏差。(2)提出了一种基于伪并行DBSCAN和网格结合的K-means算法(PPDGK)。该算法使用了DBSCAN算法和网格划分技术对数据集进行初始预聚类,有效的排除了数据集中的“噪声”和孤立点,得到了高质量的初始聚类中心,从而有效的提高了聚类精度。由于在预聚类时使用了伪并行技术,使得预聚类时间减少。在得到高质量的初始聚类中心后,算法收敛速度加快,使得该算法整体聚类时间减少。仿真实验表明,PPDGK算法在聚类时间和聚类精度上都要优于K-means算法。(3)将PPDGK算法应用到零售业的客户细分中。首先论述了客户细分的方法,然后详细论述了PPDGK算法的零售业客户细分系统的总体设计,最后给出了该系统的实现和性能分析并对PPDGK算法的细分结果进行了详细的描述。在系统中分别使用了PPDGK、K-means和DBSCAN算法对同一组样本数据进行细分,细分结果表明,基于PPDGK算法能有效排除样本数据集中的“噪声”点,它在细分结果的质量上要优于其他两种算法,而且细分的时间也比其他两种算法少。