论文部分内容阅读
伴随着信息和通信技术的飞跃发展,第4代通信技术即4G技术登上我国的通信舞台。4G时代数据的高传输速率使其通话记录、音频、图片和视频等数据呈爆炸式增长。而根据调查发现,如果不采取任何措施,电信部门每年会流失24%以上的用户,这对电信运营商带来的损失将会特别大。数据挖掘技术可以从电信海量的用户数据中发现用户的消费偏好,进而根据不同的消费类型提出相应的策略来最大限度的保留住运营商现有的用户。因此,数据挖掘在电信行业用户流失预测和管理中起着举足轻重的作用。 本文首先研究了数据挖掘聚类和分类算法的比较分析,并提出了改进的K-means算法-DHK-means算法,该算法将基于密度和基于凝聚的思想运用到K-means算法中,使K-means算法能够选取最优的初始聚类中心个数,进而得到最优的聚类结果;其次,应用DHK-means算法和决策树算法建立了电信用户流失预测模型,同时把电信用户消费的数据流量加入到模型分析中,使模型更加贴合现实;最后对模型进行了实证分析,验证了模型的有效性和准确性。