论文部分内容阅读
随着国内电信市场竞争的同趋激烈,电信运营商的经营模式逐渐从“业务驱动”向“客户驱动”转化、从“粗放式经营”向“精确化管理”转变。为了更好地做到对企业的决策支持,经营分析系统孕育而生。
本文的目标是在电信经营分析系统下,研究数据的处理流程,重点研究数据挖掘理论与技术在系统中的应用。
本文首先简要概述数据挖掘的概念、挖掘过程模型、数据预处理、数据挖掘分类、常用技术、热点研究方向,以及数据挖掘和数据仓库、数据挖掘和OLAP之间的关系;
接着介绍经营分析系统中客户细分所应用的数据挖掘技术--聚类算法,包括聚类的定义、算法的要求、主要的聚类方法以及k-means算法原型和改进方向,并着重介绍基于K-D树的改进k-means算法;
然后对电信经营分析系统进行概述,主要涉及该系统的建设背景、功能架构、数据挖掘技术在系统中的实际应用,并结合数据仓库、OLAP、数据挖掘在系统中的定位对系统中的核心数据处理流程进行详细介绍。
本文第5章(核心章节)根据标准的数据挖掘过程模型CRISP-DM、应用改进的初始聚类中心选取方法和基于K-D树的改进k-means算法对某地电信公司经营分析系统的客户细分过程进行详细的描述。
首先是电信客户信息的组成、数据挖掘的基础-宽表结构等的介绍,接着给出聚类模型的整体结构、各主要模块功能及处理流程,并从业务上对细分的结果进行解释和特征描述,给出相关的营销建议,起到决策支持的作用。
最后结合实验数据,分析改进算法的参数设置问题,验证改进的k-means算法相比标准的k-means算法在效率上和稳定性上都有较大提升;同时针对本文算法中的不足提出进一步的改进意见。