论文部分内容阅读
加密流量的有效识别和管理对维护用户权益,保障网络安全运行有着重要意义。本文结合国家863计划十一五重大课题高可信网络业务管控系统的研究需求,重点研究网络加密流量协议不相关在线识别算法及系统设计技术。以加密数据的随机性检测为切入点,本文的研究工作包括四个方面:第一,加密数据识别基础研究,以及网络非密数据非随机特征的发现;第二,适用于网络数据的随机性评估算法研究;第三,网络加密流量识别算法研究;第四,网络加密业务流在线识别系统的设计。首先,针对当前加密流量协议不相关识别缺乏工程科学研究的问题,对传统的流量识别方法和加密流量识别方法做了系统总结和分析,归纳了基于随机性评估实现加密流量协议不相关识别的思路。对网络数据隐含的随机性特征展开研究,引入随机性检验方法,将随机性检验方法的应用环境从原本的伪随机数发生器检验扩展为数据的随机性评估,并建立了评估指标。通过覆盖全面且相互独立的检验测试,获得了网络数据中其隐含的随机性特征。仿真结果表明,网络数据中隐含的有关数据均匀性的随机性特征最为显著,有关低线性复杂度及周期性的随机性特征最不显著,这是由网络非密数据的构成特点决定的。本章的内容为适用于网络数据随机性评估算法的设计提供了理论和实验依据。第二,针对网络数据的随机性评估问题,在之前研究的基础上,提出了适用于网络环境的数据自适应在线随机性评估算法DARE(Data Adaptive Randomness Estimation)。在接收网络报文的同时,在线输出评估值,并随着报文数据量的增加,动态提高评估性能。将DARE算法与同类算法(熵估计算法)进行了比较。结果表明,该算法适合网络数据处理,具有空间耗费小,区分度高的特点。具有高区分度的随机性评估算法为高准确率的加密流量识别算法设计建立了基础。第三,针对加密流量协议不相关在线识别算法设计问题,在DARE算法的基础上,提出了一种新的滑动窗口DARE算法(Slide Window DARE, SW-DARE)。SW-DARE算法通过对同一个数据流进行多次判定,综合生成识别结果。与已有的同类加密流量识别算法相比,SW-DARE算法的优势是协议不相关,准确率高。SW-DARE算法为网络加密流量协议不相关的识别提供了有效工具。最后,针对骨干链路的高性能处理要求,设计了一种网络加密流量在线识别系统MFDI(Multi-channel Feedback Data-degression Identification, MFDI)。该系统能够综合多种识别算法,最大限度利用低开销识别算法和高识别率算法优势,识别结果动态反馈、约减数据输入,实现低开销、高性能的加密流量在线识别,从而增强系统容量扩展能力,实现功能平滑升级。配以其它业务识别组件,该系统也可应用于其它业务流量的识别。