论文部分内容阅读
网络流量分析是认识、管理、优化各种网络资源的重要依据。网络流量自相似长相关、非线性特性的发现,对传统网络理论提出了挑战,使得对网络流量概率分布的精确建模变得非常困难。本文从机器学习的角度研究网络流量分析。重点研究学习算法如何根据测量所获得的数据来提高分析的性能。针对网络流量分析的特点,本文提出一个基于机器学习的网络流量分析概念模型。该模型旨在最大限度地利用测量获得的流量数据和人的监督信息,自动完成流量分析的各个任务,支持各种上层应用及对网络的性能优化。同时,模型通过主动学习,指导主动式测量的进行。对于网络流量预测,本文提出一系列基于机器学习的算法:分类模型下基于支持向量机的预测算法;分类模型和回归模型下基于Boosting的预测算法。针对流量中的非线性因素,设计了不同的弱学习算法;针对流量的自相似结构,提出了两种不同的机制;针对过匹配现象,提出自适应的权重更新机制。对于异常网络流量检测,本文提出了一个基于核主成分分析的算法及其简化版本,该算法通过刻画流量中的非线性因素,有效地提高了算法的性能。另一方面,通过设计不同的弱学习算法,将Boosting引入到异常网络流量的检测。本文从机器学习的角度研究了网络流量分析。就具体的学习算法而言,本文考察了机器学习领域两类非常具有代表性的算法:基于核的学习方法和基于Boosting的学习方法。就具体的分析任务而言,本文考察了两个在理论上和实际中都很重要而又基本的分析任务:对正常网络流量的预测和对异常网络流量的检测。针对流量的自相似、非线性的特点,本文设计提出了一系列的算法,并通过系统的实验,验证了算法的有效性。论文工作对在CERNET开展流量分析具有方法论上的指导意义。对基于流量预测的各种应用和基于异常流量检测的网络安全,具有一定的实用价值。