基于数据挖掘的欠费预警系统的设计与实现

来源 :中南大学 | 被引量 : 0次 | 上传用户:guider_zq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
欠费问题一直是电信面临的一个严重问题。通过对已有欠费数据使用数据挖掘技术来对欺诈客户的行为进行分析和预测,达到对欺诈行为的侦察与防范,这在发达国家目前也不够完善,在中国则几乎处于起步阶段。电信欠费属于数据挖掘中的分类预测问题,通过历史欠费和未欠费数据找出欠费模式,并用此模式对未判定数据进行分类。数据挖掘中常用的分类方法有决策树、贝叶斯分类、神经网络、遗传算法等,其中决策树因为直观,易于理解,得到较为广泛的应用。本文将基于gini系数的CART算法与基于信息熵的C4.5算法和ID3算法置于电信数据中进行比较,找出最适合电信数据的算法,然后将这一最优算法与递增式学习算法相结合,得到改进算法,使其能够处理递增的数据。以改进算法为核心建立电信企业欠费客户预警系统,对可能欠费的客户及时地在线识别,从而最大限度地减少由此造成的损失。在系统的实现过程中,采用观察法随机收集数据,采用双变量统计分析方法进行数据特征选择,以分类树的代价-复杂性最小为标准剪枝,以误分类代价的诚实估算值最小为标准,采用测试样本估算法选择最优子树,采用简单验证方法对模型进行评估。
其他文献
在传统有监督学习问题中,若要得到性能较好的模型,往往需要在大量已标记样本上进行训练学习。但在很多实际任务中,特别是处理多标记、多模态等复杂数据时,样本标注十分困难,
随着Internet的迅猛发展,网络的信息量和访问量飞速增长,服务器超载的问题日益严重,Web服务器集群技术提供了一种有成本效益的高性能解决方案。集群系统的关键问题在于如何有效
ISO10160(信息和文档:开放系统互联—馆际互借服务定义)/ISO10161(信息和文档:开放系统互联—馆际互借协议说明)是不同图书馆之间实现馆际互借服务的国际标准协议。该协议描
本文通过对JPEG2000压缩技术算法进行分析和研究,对离散小波变换采用将拉伸步和提升步分开计算的快速提升算法,达到消除重复运算的目的; 通过对标准下的CDF9/7滤波器的系数进
随着软件开发规模和复杂性的不断提高,软件危机愈加明显的暴露出来。提高软件生产率成为软件产业的当务之急,基于软件构件的软件复用技术成为解决这一危机的重要技术。本文针
随着三维网格模型被广泛应用于3D游戏、虚拟现实、3D地图搜索系统等移动终端应用中,这些三维网格模型应用已成为人们生活中一部分。但这些模型在面向移动终端流式传输过程中遇
时空数据库是在空间数据库的基础上发展而来的新兴数据库技术,用于处理随时间推移而变化的空间信息。最近邻(NearestNeighbor,NN)查询是在空间数据库和时空数据库中经常会使用
视频的艺术风格化是非真实感图像渲染研究的一个重要领域,有着很好的应用前景。与传统的真实感图形不同,非真实感图像渲染着眼于对真实的场景进行抽象和加工,以突出其中的重
本文研究了新一代的分布式仿真体系结构HLA和联邦开发与运行FEDEP模型,并以开发电子对抗仿真系统联邦为例,研究了联邦开发的通用技术,总结了开发联邦过程中使用的方法和工具
机群保障是飞机选择保障停机位,在停机位上完成保障工序的加工,以及选择起飞位起飞的过程。高效的机群作业保障关系到飞机的快速出发和降落,对提高机场的运营效率起到至关重要的