基于不完全电信数据的挖掘方法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:JackCF1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电信市场的开放,客户选择电信业务及电信企业的余地越来越大,电信企业之间对客户的争夺也越来越激烈。大量低忠诚度客户转网或变更业务,即使采取相应的预防措施,也不能有效地遏制大规模客户流失的现象。另一方面,电信客户近几年高速增长,形成庞大、需求差异很大的客户群体。同时,由于电信技术的发展和创新不断生成各种新型业务。如何细分市场和客户群,将最合适的业务推销给最需要的客户,实现业务和客户的最佳匹配是电信企业的重要课题。 电信企业逐渐意识到以客户为中心经营的必要性,开始从业务驱动向客户驱动转化。通过分析业务支撑系统中海量的数据,对市场、客户进行挖掘分析,实现精细化营销。电信行业各类业务系统的建设,积累了海量的数据,这些数据不仅是历史记录的呈现,也蕴涵了客户的消费模式,为客户分析提供了丰富的素材,也为数据挖掘系统提供了宽广的用武之地。 本文介绍了适于不完全电信数据的若干数据挖掘技术和方法,以南京市网通用户部分通话记录为实验数据,系统地研究了基于不完全电信数据的客户细分、交叉销售和客户流失等挖掘方法,并在研究多种数据挖掘评价方法的基础上对其中基于损失函数的标准展开了深入研究。 客户细分选择了高效的k-means算法,并做了数据预处理,以最大程度的提高运算效率。结合行业的具体情况,对客户细分的实验结果作了详细的解释,并给出了积极的业务建议。 交叉销售也是电信行业的一个重要挖掘主题,从大量前人的研究成果分析来看,关联规则最适合于解决交叉销售的问题。本文基于经典的Apriori算法,并在其基础上做了“预剪枝”处理,保证了算法的简洁性也提高了算法效率。实验数据证明了改进后的Apriori算法的可行性和效率上的改善,并对实验结果做出了相应的解释和业务建议。 本文分析了客户流失分类、比率与主要原因,提出了一种客户流失分析方法,以C4.5决策树作为客户流失分析的主要手段。 本文介绍了多种数据挖掘评价方法,并对其中基于损失函数的标准展开了深入研究。提出了一种考虑收益损失的混淆矩阵(扩展的混淆矩阵),说明了如何以利润最大化为目标来判断具体的挖掘模型。另外,还介绍了ROC图,具体分析了如何用ROC图来评价分类模型。
其他文献
网络技术的迅猛发展特别是基于Internet应用的不断涌现,使网络从信息基础设施逐步演变成人类社会的基础设施。由于Internet发展的高度异构性和变化性,基于其上的应用与网络本身
安全问题是当前网络多媒体应用中比较突出的问题,目前用于解决该问题的技术很多,其中的数字水印技术,尤其图像数字水印技术,以在版权保护方而的独特优势而引起人们的普遍重视,成为
随着802.11系列产品的商用化,人们充分体会了宽带无线上网的便利和优势。但同时802.11在带宽,接入速率,覆盖范围,安全性和服务质量等方面存在着不足。为了满足未来宽带无线接
随着计算机应用的发展,人们迎来了“大数据时代”。在大数据时代,应用所表现出的负载特性是访存局部性差,访存延迟大等。传统的通用微处理器处理这类应用往往性能不佳。这给
随着中国对能源需求的日益增加,各项工程正紧锣密鼓的展开,天然气管道的铺设也迅速增加。但由于正常腐蚀及人为破坏等原因,造成输气管道泄漏事件也日益频繁的发生。而管道的泄漏
随着QQ、微信等网络社交应用的迅速发展,在线社交网络中的信息传播技术和信息传播效果受到了越来越多的关注。信息传播的影响力最大化问题研究在社会网络中寻找具有给定节点
计算流体力学(Computational Fluid Dynamics,CFD)采用数值计算方法求解流体控制方程,目前已广泛应用于航天航空、汽车船舶、机械制造等领域。本文针对真实复杂高阶精度CFD应用特
近两年,随着计算机网络技术的不断成熟与发展,基于浏览器/服务器模式的网络应用软件越来越多,功能也越来越丰富。各种新技术开始出现并正在逐步取代落后的技术。作为最新的技
鞍钢铁路运输公司是鞍钢集团直属大型物流企业,是鞍钢生产工艺的重要组成部分。公司下设运输总站、机车厂、电务修建公司三个厂级单位。 鞍钢铁运公司电务供电实时监控系统
车辆自动识别分类技术是智能运输系统的重要组成部分,它对特定地点和时间的车辆进行识别和分类,并以之作为交通管理,收费,调度,统计的依据。车型的自动分类在部分发达国家已