论文部分内容阅读
移动互联网与社交网络时代下各行业的数据广度和数据深度均得到了极大的丰富。海量大数据的高效挖掘分析将为社会的发展带来巨大的商业价值和深远的社会效益。高速发展的经济社会为数据分析价值带来了新的定义,即:数据价值的多元性和时空性,信息通信网络作为移动互联网与社交网络的智能管道拥有丰富的数据资源。本文以信息通信网络运维管理为背景,将群体智能理论方法应用于网络告警关联规则挖掘分析,按照由低等动物向高等动物的趋向,以典型的营群体生物(昆虫类—蚁群、鸟类—粒子群、哺乳类—狼群)行为特征为基础,提出并实现了基于群体智能的通信网络告警关联规则挖掘算法。本文研究成果对于实际信息通信网络运维管理中告警关联规则分析理论研究和应用实践研究有重要意义。本研究的主要工作和研究内容如下:(1)结合信息通信网络运维管理演进提出了网络告警管理的六种模式和告警管理体系,针对网络管理支撑系统提出了网管系统发展的四个阶段。明确给出了信息通信网络中的网络告警、告警标准化、告警标准化字段、网管系统告警标准化等的定义内涵,提出并详细论述了信息通信网络告警的数据特点及预处理流程,并将网络告警逻辑相关性由网络设备内部扩展至网络设备之间。将Apriori算法概念与模型、FP-Growth算法思想应用于通信网络告警关联规则分析,并从告警关联规则数量、算法运行时长、算法内存消耗三方面进行了算法性能评价分析,并提出了以关联率、关联强度为评价指标的工程测试分析方法。(2)通过对白蚁的筑巢活动、蚁群非对称双桥实验等蚂蚁群体生物行为观察分析实现了于信息素的最短觅食路径选择策略。本研究将生物学中的共享机制小生境技术、具有跳跃能力的印度跳蚁种群特征相结合,提出并实现了SN-APLAC算法(Sharing mechanism Niche-Apriori Leaping Ant Colony)。SN-APLAC算法利用频繁1-项集剔除TSP无向图中无效“路径点”,将无向图“路径”中所有项的子集视为潜在频繁项目集,判断频繁项集是否满足最小支持度进而获得“刺激点”;然后形成含有“刺激点”的跳蚁路径图,通过共享小生境的“交叉与变异操作”方式挖掘原始数据中新的潜在关联关系,进而形成全局数据关联逻辑规则。结合网络告警和经典关联规则挖掘算法从性能测试(规则数量、蚂蚁个数、迭代次数与内存资源关系、SN-APLAC算法与Apriori算法/FP-Growth算法性能差异)和工程测试(关联率、关联强度)两方面综合评估了SN-APLAC算法的整体质量。(3)以鸟群觅食行为抽象形成的粒子群算法为基础,构造样本粒子群、候选粒子群和规则粒子群实现APPSO算法(Apriori Particle Swarm Optimization)基本思想。通过网络告警ID的排序编码、基于稀疏链表的支持度计算和Apriori算法性质三个维度进行优化,最终提出并实现了APPSO算法逻辑。结合网络告警对APPSO算法与Apriori算法、FP-Growth算法进行了性能测试分析(支持度/置信度/粒子群规模与关联规则数量的关系、迭代次数与运行时间的关系)和工程测试分析(关联率、关联强度)。(4)通过对狼群社会等级、觅食攻击的群体行为分析提出了基于头狼、探狼、猛狼的AWPS算法(Apriori Wolf Pack Search)基本逻辑。结合通信网络告警分布特征提出了以压缩函数为基准的“等宽”边界压缩划分方法,并将其应用于探狼、猛狼的寻觅猎物过程和狩猎目标过程,最终形成AWPS算法过程。结合网络告警对AWPS算法进行了性能测试(狼群规模、迭代次数与关联规则数量关系、狼群种类分布与关联规则总量关系、AWPS与Apriori算法/FP-Growth算法的性能比较)和工程测试(关联率、关联强度)进行了详细的分析讨论。