论文部分内容阅读
随着信息化的到来,各类数据急剧膨胀,面对海量的存储数据,如何从中发现有价值的信息或知识是一项非常艰巨的任务。数据挖掘就是为了满足这种要求而迅速发展起来的。数据挖掘是从大量的、不完全的、有噪声的、模糊的和随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘作为一门新兴的边缘学科,汇集了来自数据库技术、统计学、机器学习、高性能计算、模式识别、神经网络以及管理信息系统等各学科的研究成果。其发现的知识可以用于决策、过程控制、信息管理、查询处理等方面,具有重要的实践意义。国内外对于垃圾短信监控有比较多的结合数据挖掘技术的过滤、拦截方法,而对于骚扰电话系统的监控技术没有系统的理论。如何在海量数据中快速、准确地查出所有骚扰电话号码,减少误判,减少省客服人员回拨确认的工作量,是骚扰电话监控系统的重心。因此,本文首先分析了当前已有的骚扰电话监控系统的不足,提出了将数据挖掘技术引入监控系统的设想。其次,介绍了建立骚扰电话监控系统的相关技术:7号信令监测、数据挖掘技术等。最后,通过对贝叶斯算法和K-means算法进行分析研究,提出针对实际工程项目,采用改进贝叶斯算法、指导性K-means算法等技术建模以及验证过程。对应用数据挖掘技术的骚扰电话监控系统性能测试表明:将改进的贝叶斯算法、指导性的K-means算法应用于实际的骚扰电话监控和拦截功能中。采用了数据挖掘的监控系统给通信企业带来了成本效益和社会效益:可比较准确性地智能辨别出骚扰电话号码,并智能化地对骚扰号码实施拦截,从而降低省客服人员处理骚扰电话的工作量,同时有效拦截骚扰电话,降低了移动用户对骚扰电话投诉量,提升了客户对网络质量的感知,为湖南移动构建了绿色的网络。