论文部分内容阅读
随着电信网络的规模和复杂度不断增大,导致网络故障告警种类和数量不断增加、告警信息之间的关联也更加复杂,而用于故障诊断的告警相关性分析系统中规则知识的获取主要依赖专家经验,从而使得网络故障管理效率不高。针对电信网络中故障告警相关性分析效率不高的问题,本文提出基于加权关联规则挖掘的告警相关性分析优化解决方案。论文的主要工作体现在:(1)提出了改进的告警事务提取方法。考虑电信网告警数据发生时间分布不均匀的特点,传统的均匀滑动时间窗方法不能有效的提取告警事务,本文利用聚类算法将告警按发生时间分成若干密度相对均匀的组,然后组内采用均匀滑动时间窗方法提取告警事务,从而提高告警事务提取的效率。(2)采用熵值法来确定告警权值。由于熵值法是一种客观赋权法,在处理告警权值时可以减少人工的参与,避免了人为因素带来的偏差,适合于数量庞大的告警数据库。本文将告警信息的告警级别和节点路径两个主要属性作为评价指标,通过计算它们的熵权来确定告警的权值,对比其他告警权值确定方法(如:层次分析法)更加实用和有效。(3)提出了改进的加权关联规则挖掘算法(WEclat)。针对已有加权关联规则算法需要多次扫描数据库,效率不高的问题,提出基于Tidset数据压缩和WIT-树结构的加权关联规则挖掘算法,该算法只需扫描数据库一次,并利用位运算计算支持度以及数据压缩技术减少内存消耗,从而提高挖掘算法效率。(4)提出了基于磁盘存储1-项集Tidset的加权关联规则增量挖掘算法(IWEclat)。为了提高增量环境下加权关联规则挖掘算法的效率,分析WEclat算法时间消耗的关键步骤,提出基于磁盘存储1-项集Tidset的加权关联规则增量挖掘算法,避免算法重新扫描原数据库和重新生成1-项集Tidset,减少了算法的时间消耗。(5)为了验证、评估本文提出的各种算法,本文基于实习公司网管系统中的告警数据,设计了电信网告警相关性分析系统的模型,并实现了系统的关联规则挖掘模块。