论文部分内容阅读
在这个信息化产业不断发展的现代社会,无论是在生活中还是在工作中,人们对通信网络越来越依赖。如果通信网络不能正常运行,将会给人们带来极大的不便甚至是经济损失。所以,确保网络正常地运行至关重要。要确保网络正常地运行,就必须在网络出现故障的时候,及时而准确地找到故障源,然后解决故障问题。网络发生故障时,网络中的节点会产生大量的告警。这些告警之间存在一定的相关性,找到这种相关性将有助于故障的定位。如何找到这些海量告警数据之间的相关性是一个研究重点。在处理海量数据的方法中,数据挖掘技术具有很大的优势,该技术将大量的工作交给计算机来处理,既提高了效率也省去了很多人工劳动。不少科研人员将关联规则挖掘用于网络故障诊断中,取得了一些成果。但是,告警与故障源之间的对应关系不是一对一的,具有很强的模糊性。传统的关联规则挖掘没有考虑这种模糊性,致使故障诊断的准确性降低。另外,大型通信网络通常会划分成不同的域进行管理。这种分布式结构下,单单挖掘各个子域的域内的告警关联规则是不够的,还需要挖掘域间的告警关联规则。本文针对告警与故障根源之间的模糊性,在多域分布式网络的背景下,将模糊理论与数据挖掘中的关联规则挖掘结合,对网络告警进行模糊关联规则挖掘,以分析告警之间的相关性。具体的研究内容和创新点如下:1.针对原始的网络告警不适合用于关联规则挖掘的问题,论文在网络告警预处理阶段,对告警信息进行了字段提取,统一了告警信息模型;运用时间窗口、滑动步长机制建立了告警事务库;对告警的各个属性进行量化处理后运用模糊聚类算法FCM进行告警模糊化处理,最终建立了模糊告警事务库。本文对基于点密度的FCM算法初始化方法进行了改进。且在全局-局部与局部-局部分布式系统模型下,事务库同步建立方案和对告警模糊化的处理略有不同。2.针对两种经典模糊关联规则挖掘算法——Apriori算法和Fuzzy FP-tree算法的不足,即Apriori算法时间效率较低、Fuzzy FP-tree算法处理模糊属性的能力方面的不足,提出一种时间效率较好,且适合处理告警模糊属性的基于线性链表的告警模糊关联规则挖掘算法LLB-FARM。3.针对两种不同的分布式系统模型提出了不同的分布式挖掘算法——全局-局部算法和局部-局部算法。并在局部-局部模型的算法中提出两种不同方案——数据传输效率优先方案DTEPS和站点平均挖掘时间效率优先方案SAMTEPS,两种方案适合不同的场景。最后通过实验仿真验证了本文所提出的算法具有良好的时间和空间可扩展性,可以有效地挖掘多域分布式网络的告警模糊关联规则,为网络故障诊断系统的模糊推理模块提供告警相关性数据。