Hadoop聚类在电信客户差异化催缴中的研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:hanqianghuoer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电信业的迅速发展,其用户基数迅速增长,同时用户欠费的现象也日益增长,如何在改善客户感知的同时提高客户欠费催缴效率,成为电信运营商急需解决的难题。为此,可以应用数据挖掘技术,分析客户的欠费催缴信息,把欠费客户分类,针对不同类型的客户使用不同的催缴方案,实现客户差异化催缴服务。此外,传统的单机聚类方法已无法满足海量数据的处理需求,云计算的出现解决了这一问题,为聚类分析提供了一个新的发展方向。本文以南昌市电信客户信息为研究对象,在对目前电信欠费催缴模式和电信客户欠费催缴数据特征的分析基础上,构建针对欠费催缴模式的电信客户数据对象;分析云计算和聚类技术在电信用户差异化催缴领域的应用技术,研究基于Hadoop的MapReduce并行编程方法;针对K-means初值敏感的问题,提出了基于多次采样和空间密度的K-means优化策略,尽可能地减小聚类结果对初始聚类中心的依赖性,提高聚类的稳定性;提出基于Hadoop平台上的K均值优化算法(本文命名为MRDK-means算法)和实现方法,选取了UCI数据库中Iris和Wine数据集对包含MRDK-means算法在内的几种聚类算法进行了准确率、运行效率和加速比的实验分析;建立电信客户欠费催缴信息数据仓库和电信客户欠费催缴管理系统,提供集成聚类分析的客户差异化催缴、催缴效果分析、成本分析、代维管理等功能,并采用ASP.NET、Ajax、Web服务、多线程等技术增强了用户体验效果;最后,总结了课题研究工作,并对下一步的研究工作进行了展望。
其他文献
本文结合国土资源部三峡库区专项基金(SXKY4-041)等项目,采用范例推理技术CBR(Case Based Reasoning)结合其他人工智能技术作为边坡稳定性评估的理论基础,针对三峡库区(Three G
当数据在工作流中流动时,执行操作的用户在改变,用户的权限也在改变,这与数据处理的上下文环境相关。采用传统的访问控制技术,如DAC,MAC,则难以做到这一点,若采用RBAC,也需要频繁地更
本文基于面向对象的思想给出了图形系统的各种模型,主要讨论了图形类库,通用图形编辑系统,以及动画制作技术,针对动漫设计中各种基本图元的数据描述的数据结构进行了定义,也对各种
随着多媒体网络应用数据流在Internet中的增加,使Internet的“尽其所能”的服务难以满足新数据流的服务质量的需求,加上单根光纤的通信速率有多个数量级的提高,网络节点(路由器/
作为互联网的一大应用,电子邮件一直受到人们的青睐,并已成为人们日常生活中通信、交流的重要手段之一。但是近些年来垃圾邮件问题日益严重,中国网民平均每周收到的垃圾邮件数量
随着互联网的普及和规模的急剧扩张,作为网络80%以上信息的主要表达方式,各种各样的电子文本得以迅速膨胀,往往造成大量无用信息淹没了有用信息,出现了信息极大丰富知识却相对贫乏
最近,随着生物免疫学的丰富和完善,一个全新的免疫理论——危险模式理论(Danger Theory),对传统SNS模式的现代免疫学基本理论提出质疑,打破自体耐受,从空间概念上改变了传统模式的
随着计算机技术和网络技术的发展,分布式实时系统在信息家电、医疗仪器、智能汽车、工业控制以及通信设备等各个领域已经比较成熟了。一直以来,实时任务对时间的特殊要求使得实
目前,企业资源计划(ERP)已经越来越广泛的应用在制造业车间。如何提高 ERP 在生产管理中的实用性,真正把车间调度纳入其中,帮助企业科学的规划生产,已是摆在新一代制造业ERP开发
中国的书法艺术历史悠久,博大精深。书法字应用也极为广泛,牌匾就是其中重要的应用之一。本文主要研究利用计算机技术自动生成书法牌匾,用户只需提供牌匾的内容,系统从书法家字库