改进的模糊聚类算法及其在电信欠费数据中的应用研究

来源 :天津理工大学 | 被引量 : 2次 | 上传用户:yuezhiyaodao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电信市场的迅速发展,目前我国通信设备的覆盖率已到达了很高的水平,手机用户的数量逐年增加。电信运营商要保持市场的高效运作,必须依据不同地区,根据不同的人群来划分不同的收费标准,同时应采取运营策略防止用户出现大额欠费现象和欠费换号现象。而电信客户是一个庞大的群体,如何通过分析大量的信息来进行运营决策是目前的一个难题,数据挖掘技术在海量信息处理方面的优势使得数据挖掘在电信领域中有了更广阔的应用空间。数据挖掘中的聚类技术可以将要处理的对象聚类分析,应用在电信市场分析中,表现为能从客户基本库中发现不同的用户群,并且刻画出不同客户群体的特征。本文就是基于电信欠费用户的特征,在现有算法的基础上提出适合电信行业数据特征的聚类分析算法,以此分析出电信用户的欠费特点,为电信制定相应措施提供理论依据。本文主要研究工作有:首先对聚类算法进行研究,在模糊C-均值(FCM)聚类算法基础上,提出基于信息熵的FCM算法。此算法的优点是首先利用信息熵来对聚类中心进行初始化,从而确定聚类中心的个数,以此降低初始聚类对算法产生的误差,然后结合类合并的思想,将大簇或任意形状的簇分割成多个小簇,再根据类合并的条件将各个小簇合并,这样就可以解决不规则数据集的聚类。之后又在基于信息熵的FCM算法的基础上引进加权因子,使得算法在聚类过程中对聚类中心的位置不断调整,从而更加接近实际的中心位置,算法的迭代次数也要少于传统的FCM算法,使得算法的运行效率得到了很大提高。而且加权因子的引入使得算法能够对孤立点进行一定的分析处理,提升了算法的精确度。最后应用实例证明了基于熵加权的FCM算法的高效性。其次将改进的算法应用到电信欠费数据的分析中。本部分首先将电信数据库中有关计费的属性提取,对数据进行清洗操作,将所研究数据转化为符合算法输入的标准数据格式,然后分别用FCM算法和改进算法对数据进行聚类,得出聚类结果并进行比较。通过比较发现改进算法的聚类结果比较理想,这也证明了算法的实用性。同时,通过对欠费数据的分析,挖掘出了数据中的隐含的信息,从而可以为电信运营商提供可靠的欠费应对策略。本文的创新处与成果在于:(1)在FCM聚类算法的基础上提出了基于信息熵的FCM算法,降低初始聚类对算法造成的误差,同时也提升了算法的运行效率。(2)在基于信息熵的FCM算法的基础上又引进了加权参数,更进一步提升了初始聚类中心位置的精准度。(3)将改进的算法应用到电信欠费数据的分析中。一方面证明了算法的实用性,同时也为电信运营商制定相应的策略提供了理论依据。
其他文献
RF-SIM(RFID-Subscriber Identification Module)卡是基于无线射频技术,可实现近距离无线通信的手机智能卡,可用于移动设备、消费类电子产品、PC和智能控件工具等设备。中国
网络安全问题的凸显,使个人防火墙成为保护主机安全的主要手段,目前国内外学者都对智能化的个人防火墙进行了不同层次的研究,信息筛选技术作为最成熟的防火墙技术在防火墙的
随着web2.0时代的到来和社交媒体的广泛兴起,短文本出现在互联网的各个角落。信息检索,广告关键字,网页标题,锚文本,在线问题,微博以及评论等信息都属于短文本。短文本更新速
本课题来源于山东丝绸纺织职业学院在引进知识管理方法、并建设相应的信息化系统过程中的实践探索。知识管理(KM, Knowledge Management)是网络新经济时代的新兴管理思潮与方法,管理学者彼得·德鲁克早在一九六五年即预言:“知识将取代土地、劳动、资本与机器设备,成为最重要的生产因素”,“21世纪的组织,最有价值的资产是组织内的知识工作者和他们的生产力”。在信息时代里,知识已成为最主要的财
人工神经网络在一定程度上受到生物学的启发,是自然界生物神经网络的一种近似和模拟。其主要从两个方面进行模拟:一种从结构和实现机制方面进行模拟,即人工神经网络结构模拟生物
现在每天都有大量数据需要提取和分析,数据挖掘技术在许多实际应用中获得巨大成功,分类模型已经在许多应用场合得到广泛应用,如原油泄漏检测、信用卡检测、医疗检测等等。由
随着大数据时代的到来,海量数据在企业以及人们的日常生活中都有广泛的应用。数据质量对数据的应用效果起着至关重要的作用,其中数据时效性问题是数据质量的主要影响因素之一
近年来随着电子商务的蓬勃发展,作为电子商务基础的电子现金领域的研究得到了国内外科研人员、工程技术人员的广泛重视。作为一种新兴的以电子(或数字)模拟真实货币的技术,电子
随着电力调控系统的服务范围不断扩大,数据来源增多,数据类型多样,数据规模和处理压力急剧增大,调控业务对海量多源数据分析处理的要求不断提升。本文面向电力调控系统大数据
随着半导体技术、微系统技术、嵌入式技术和无线通信等技术的高速发展,使得微传感器节点的处理能力更强、功能更丰富、体积更微型化,能够集信息采集、数据处理和无线通信等功能