论文部分内容阅读
中国的电信市场十分庞大,电信服务网络系统日益复杂化,单纯用传统的人力资源管理这个庞大的运营系统开始变得困难起来。同时,一些电信用户恶意欠费或是利用技术手段享用了电信商提供的网络服务但是没有按规定缴纳足额的费用,给运营商带来了收入的缺失。无论是因为复杂的网络系统使技术欺诈有机可乘,还是因为用户恶意欠费,都给电信运营商造成收益风险。本文主要是防范电信欺诈,尽量减少电信运营商的收入流失。根据数据挖掘理论构建反欺诈系统框架,然后分析和总结电信欺诈特点,从而提取欺诈特征项,经过反复的数据分析和结果评测,确定了针对该问题的具体算法和参数系统,即“欺诈特征树节点阈值检测算法”这个反欺诈算法形成的最初灵感来自BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)算法中的特征树理论,还有基于聚类的异常检测算法、入侵检测算法和数据关系模式研究等。本论文的具体算法是在电信欺诈特征分析和电信用户属性信息、费用信息、呼叫信息的数据分析基础上,对用户数据项进行规约处理后提取欺诈特征项,并构成一棵欺诈特征树。树上每个节点对应一个判定阈值和相应的权值,数据流从树的根节点出发,依次到叶子节点,若用户的欺诈特征值在阈值之上,则需要根据权值修改用户欺诈度的值。轮循完所有的欺诈特征项后,最后看用户欺诈度的值是否超过设定的欺诈阈值,若超过,则输出用户信息,交给反欺诈系统上一层处理,从而对可疑用户进行预警或者进一步核查分析。本文的创新性还在于对数据的处理和分析上,数据挖掘理论仅仅提供了处理海量数据的步骤和方法的方向性框架,对数据从抽象的、零碎的认识过度到有章可循的、有特定行为模式和形象直观的认识,还需要依赖于数据分析工具的运用。本文采用到的数据分析工具包括Matlab、Office办公软件Excel和PowerPoint,程序处理工具为Eclips和Oracle.