论文部分内容阅读
网络故障管理是网络管理的一个重要组成部分,故障管理的有效与否和功能强弱直接关系到被管理网络的可用性和可靠性。故障检测是网络故障管理的前提,而故障检测的一个重要手段是网络异常流量检测,原因是网络流量数据可以及时反映网络故障状况。目前常用的是基于SNMP(Simple Network Management Protocol)的网络故障检测机制,该机制采用Client/Server技术进行集中式故障检测。如果该机制采用Trap检测方法,则过分依赖整个网络,多节点的连接中断会导致全网失控;如果采用轮询的检测方法,则对突发性故障检测有明显的滞后性。所以该机制无法对大规模、突发性网络故障进行检测。本文将链路流量和路由器转发数据量的突变以及拥塞导致的流量异常所造成的大规模、突发性网络故障定义为突发毁击事件。针对这类事件,提出一种新的故障检测机制,通过对节点和链路的同时检测,综合判定故障原因并划分故障等级。其检测结果为快速自愈协议进行故障避绕提供依据,并对流量进行预测来确定故障避绕后的网络状况。本文主要包括以下几个方面工作:(1)针对节点故障检测问题,提出一种自适应阈值残差比流量异常检测算法。该算法是在研究时间序列检测算法和残差比检测算法优缺点的基础上,为达到精确刻画网络行为特征,减小固定阈值带来的虚警和漏警的目的,将残差比检测算法中的固定阈值改进为自适应阈值,对网络流量进行异常检测。同时通过离线阈值计算,提高检测速度。仿真结果验证了本算法的正确性及性能;(2)针对链路故障检测问题,在对已有流量突变检测算法研究的基础上,提出一种基于聚集函数的流量突变检测算法。该算法基于改进的直方图技术,结合聚集函数查询的方式,对网络流量进行突变检测。利用直方图技术压缩存储数据的优点,将其与聚集函数结合进行相邻等长窗口的流量异常判断。通过仿真对算法的检测精度和速度进行分析;(3)针对快速自愈协议进行故障避绕后网络状况监测的问题,提出一种基于卡尔曼滤波的网络流量预测算法。该算法通过将卡尔曼滤波的基本原理同网络实际情况相结合,对网络进行建模。算法的目的是验证势能调整后的网络是否正常工作,是否能保持正常通信。通过仿真对算法有效性及正确性进行验证;(4)针对现有故障管理系统难以满足课题需求的问题,设计一种基于网络异常流量的突发毁击事件管理系统。该系统应用在网络节点路由器中,通过对网络流量检测及时发现网络故障,全方位立体式保护网络。系统综合检测结果确定网络故障原因,对故障进行等级划分和定向通告,最终通过快速自愈协议调整机制避开网络故障,并利用预测算法对调整后的网络进行评估。设计系统可视化操作界面,同时结合离线统计的方法,给出链路状态指数和网络依赖关系图,指导后续的故障检测并为日后工作提供理论分析依据。