论文部分内容阅读
网络测量是掌握网络运行状态,理解网络运行规律的重要手段,被动测量是网络测量中获取数据的重要方法。对于获取到的海量被动测量数据,如何了解其特征从而进行更有针对性的测量分析具有重要意义。本文以一个网络海量被动测量数据管理系统IPTAS的实现为背景,重点讨论其中的公共流量测度计算和异构测量数据访问子系统。
论文首先对现有的网络测量数据库进行了介绍,接着通过对IPTAS需求的分析,给出本文的研究目标和主要研究内容。
其次,论文介绍了Trace描述测度的选取,明确选择测度的原则,重点针对Trace提供多层次的基本测度,在选择测度的同时应考虑存储测度值所需的空间开销;随后讨论了测度分析中常用的两个算法:计数和TopK排序技术。接下来,本文给出一组测度的定义及测量流程,主要包含两类测度:
①报文测度:在报文层次对Trace的特征进行描述,主要包括字节数、报文数等吞吐量信息,报文长度分布,协议比例分布和端口分布等测度。
②流测度:在流层次对Trace的特征进行描述,主要包括流长分布、流持续时间等测度,本类测度多数由一组数值描述。同时,本文提供描述某一条流的特征的测度,如TCP流报文的逆序数,这类测度可为基于流的报文筛选提供依据。
每个测度对应一个分析程序,该程序在提供对Trace的测度描述的同时,亦作为分析程序提供给用户使用。
然后,论文介绍公共程序库如何实现读取满足特定过滤条件的报文,组流和流信息提取等公共子程序。设计报文读取流程,允许用户自主设定报文过滤规则筛选满足自己要求的报文;给出组流框架,允许用户在组流同时完成其自定义的基于流的分析工作,而不必在组流结束之后再读取流记录进行分析;改进组流算法,解决了流记录文件中流记录按结束时间排列的问题;设计流记录存储和流信息提取方案,在考虑存储空间的同时,针对分析对象数据量的不同,允许用户以不同方式完成流信息的提取。
接下来,论文给出公共程序库的功能模块划分,讨论前述各测度的分析流程并对不同执行速度的分析程序进行同步;讨论组流和测度分析生成的结果数据的存储方式,结合测度值的不同取值形式,分别为其选择合适的存储方案,并给出目录的组织方式和文件的命名方式。
最后,本文结合提出的Trace描述测度,选择Trace并对其进行分析,对得到的结果进行简要分析。验证了IP流长分布服从重尾分布的结论,并指出了IP流长及各协议类型IP流占比正在发生的变化。