论文部分内容阅读
网络业务是产生网络流量和网络行为的根本原因。对网络业务进行识别、分析和流量监测,深入了解网络业务的变化,并进行适当的网络关联与控制,对网络业务设计、运营和评估具有重要意义。
本文的研究课题主要来源于企业项目和自由研究,目的是在充分了解相关网络协议及通信原理的基础上,对网络业务进行有针对性的分析和实时的流量监控,从而为网络管理和控制提供决策信息。
本文首先概述了网络业务分析和流量监控的重要性,介绍了常见的网络业务及相关协议,并对本文中主要研究的两种业务--Web业务和DNS业务进行了简要说明。接着,对业务流量监测的方法、难点及流量分析的方法进行了系统的论述,并对本文中重点研究的一种业务流量分析方法--TopN排名分析的基本概念进行了介绍。本文着重对网络中最常见的Web业务的通信过程和协议进行了深入研究和分析,在此基础上,在本实验室自主研发的网络业务分析系统中,设计和实现了针对Web业务的URL封堵功能、重点站点分析功能和自定义业务分析功能。本文还对DNS业务的工作过程和协议进行了研究,并设计和实现了基于用户的DNS统计功能。接下来,本文对网络业务分析中常用的TopN统计方法进行了深入研究,在网络业务分析系统中实现了基于哈希表和自适应丢弃域值的TopN统计方法,并在此基础上进一步进行了减少在汇聚型TopN统计过程中缓存数据量的研究,提出了一种基于冗余数据集约束的TopN统计方法,理论分析及实验表明该方法在节约存储空间的同时,能够保证TopN统计结果具有较高的准确性。最后,文章对已完成的工作及进一步的研究工作进行了总结。