电信数据挖掘技术研究

被引量 : 0次 | 上传用户:pau998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着我国电信运营商为了适应飞速变化的外界环境进行自我的不断改革和发展的同时,电信运营商之间的竞争也演变得越来越激烈,这也给电信运营商带来了更大更多的发展机遇。电信运营商发展至今积累的海量的客户消费数据,隐藏着能够指导电信运营商更准确地进行企业决策的知识。而发现大量的数据中发现隐藏的有价值的信息,对现在的电信运营商更好地在竞争中服务客户具有重要的意义。数据挖掘正是从帮助人们从大量数据的传统分析中解放出来,提供了另一种更智能、更高效也更有成效的从数据中获取知识的技术方法。本文主要做了两部分工作,包括模糊关联和周期性数据聚类两方面的研究。第一部分探讨数量型属性在区间划分上存在的划分过硬问题,引入模糊关联规则的问题。本文对现有的模糊关联规则算法选取了其中三个算法进行了分别的总结和比较分析,包括基于AprioriTid的模糊关联规则算法FAMA、基于FP-Tree的模糊关联规则算法FFP-Tree和基于线性链表的关联规则挖掘算法FMA-LL,并用实验比较了几个算法之间的优劣性,验证了FMA-LL在模糊属性处理问题上的全面性和在算法效率上的高效性。在已有的FMA-LL算法的基础上,从线性和非线性两方面解决隶属度函数的确定问题。CURE算法利用聚类得到的中心构成模糊集,GA算法将函数参数编码经过多次遗传操作得到最优模糊集,再确定线性函数。FCM和GA_FCM算法是采用分治对每个属性模糊聚类产生对应的隶属矩阵,根据聚类中心和隶属矩阵来逼近正态模糊函数,得到正态隶属度函数。采用adult数据集做实验进行分析,实验证明CURE、GA和GA_FCM在隶属度和算法效率上各有优势。第二部分分析现有的对时间数据序列进行聚类分析的方法。现有的聚类算法通常从相似性度量的方面进行改进,但往往忽略时间序列数据周期性和连续性的特点对聚类算法的影响。本文对此问题进行了分析,尝试采用延拓的方法来解决该问题,从而改善聚类的效果。本文通过初步的实验结果表明了该方法的可行性和有效性。
其他文献
肝内胆汁淤积系指胆管树内无机械性梗阻时的胆汁流速减慢,随之出现肝脏和血液内胆汁成分(胆红素和胆汁酸盐)以及毛细胆管的酶[碱性磷酸酶(ALP)和γ-谷氨酰转肽酶(γ-GT)]潴留现象。
学风建设是各高校主抓的问题,现阶段高校学风建设存在着诸多问题,本文对现今优秀大学生群体进行了诠释,阐述了如何构建和培养大学生优秀群体,以及就三个方面简要分析了优秀大
目的:研究血管内皮生长因子(VEGF)和基质衍生因子-1(SDF-1)的协同作用对高血压脑出血患者内皮祖细胞(EPCs)增殖迁移能力的影响。方法:采集急性期高血压脑出血患者与健康对照
翻译是两个语言社会进行交际的中介,其主要任务是:把用一种语言所表达出的事物、概念、思想、情感、形象等完整准确通顺地用另一种语言表达出来。人类的翻译实践已经有数千年的
本文以“出售”语义场为研究对象,分别对语义场中各成员在上古、中古、近代汉语文献中的使用情况进行了调查,在描写的基础上分析所选语义场的历史演变情况。本文运用义素分析
提出了一种基于时空聚类算法的雷电地闪活动规律分析方法。利用广东佛山地区近十年的海量落雷数据,研究雷电地闪活动路线与地形地貌、河流、高程等的相关性,提取雷电地闪活动
本文主要研究我国高校档案馆在知识经济时代下应该构建档案后保管模式,以便更好地适应新时代的要求,笔者采用了文献研究法、对比分析法、案例分析法及定性分析法等研究方法,
《俚语证古》是近代著名学者丁惟汾《诂雅堂丛著》之一。它以方言俚语为研究对象,采用音转原理探求方言词语的渊源,为我们今天探索俗语学提供了极其珍贵的资料和线索。全书共
车间排产问题一直是企业生产问题的一个重要研究领域,而插单排产问题更是在这个研究领域占有非常重要的研究地位。插单排产的主要目的就是为了处理紧急发生的排产事件,根据企业