论文部分内容阅读
如今中国的航空公司数量众多,同时高铁的迅速发展,航空公司面临着巨大的竞争压力。然而航空公司之间的竞争,实质上是客户资源的竞争,客户价值的竞争。所以,航空公司要想在竞争激烈的社会中持续健康地发展,必须充分了解客户的需求,根据客户的需求提供最恰当的服务。那么如何了解不同客户的不同需求,怎样用最小的代价满足绝大多数客户的需求。一种行之有效的解决方案是——利用当今非常流行的多元统计学中的数据挖掘工具,对航空公司数据库中的海量客户信息进行数据挖掘,根据客户细分的结果给不同等级的客户提供差异的个性化服务。本文以南方航空公司为例,重点研究这一解决方案。 首先,本文详细阐述了客户的价值理论,航空公司客户关系管理的理论,客户生命周期理论,客户细分的方法等;然后,详细地介绍了多元统计学中的数据挖掘算法;再后,运用Python处理南方航空公司数据库中的客户数据,并应用K-Means聚类方法把客户分成了价值不等的五个等级;最后,把R语言作为数据挖掘工具,应用数据挖掘中的决策树、随机森林、支持向量机、人工神经网络等算法构建了预测客户等级的模型和预测老客户未来发展态势的模型。 对客户进行细分后,南方航空公司就可以根据分类结果对客户进行一对一的个性化服务,实现精准营销。这样南方航空公司就可以把有限的营销资源应用到最恰当的地方,让优质客户享受到更加舒适的服务。对于重要挽留客户和一般客户,南方航空公司也应采取积极主动的措施,努力把这些客户转变成重要发展客户或者重要保持客户,这样南航不仅可以节约成本,还可以获得更多高质量可持续的客户资源,从而增强南航的综合实力。 构建的预测客户等级的模型是本文的第一个创新点。为了提高预测老客户未来发展态势的模型,本文构建了两个随机森林预测函数着重去预测老客户是否为准流失客户,其中一个是高命中率函数,一个是高召回率函数。通过两者的结合,优势互补,大大提高了模型的预测效果,这是本文在方法上的重大突破,也是本文最具价值的第二个创新。