论文部分内容阅读
对网络流量进行分类识别,是现代网络管理平台的基础。这对于维护和管理网络的正常运行有着重要的意义。但是,随着加密技术的广泛使用,传统的基于内容的分类方式(DPI)已经是束手无策。而随着各种协议伪装技术的出现,传统的基于通信端口的识别方式也是越来越无力。这些问题都与加密流量的识别紧紧地联系在一起。在应用层,SSH(Secure Shell)就是使用最为广泛的安全协议,它拥有完善的认证机制、高强度的加密机制,这些措施在给用户提供通信安全的同时,也给网络管理带来了不小的难题。为此,本文采用统计模式识别的理论,对SSH隧道加密流量的识别问题进行了研究。本文围绕着如何使用统计模式识别方法对SSH隧道加密流量进行检测识别的问题而展开。本文的主要从以下几个方面进行了分析与研究:1.“握手”阶段的特征提取及模式向量的生成。本文提出了根据协议在“握手”阶段所表现出来的统计特征来对协议进行识别分类的方法。为此,首先得对加密流量进行特征提取;然后,根据所提取的特征,形成模式向量。这是应用统计模式识别理论的前提和基础,高效、简单的统计特征对识别分类有着重大影响。2.隧道流量的起止点研究。我们对SSH会话的建立过程进行深入细致地解剖,并逐阶段地分析了会话建立过程对隧道边界的影响,准确地识别出了隧道边界。准确地隧道边界能够对隧道内的协议进行精准地定位,这对于协议“握手”阶段的分析至关重要。3.设计了基于高斯混合模型的极大似然分类器。对分类器的各个环节,都编写了相应的程序来实现。同时对HTTP、SMTP、POP3、FTP四类协议进行了训练样本的采集与分类,得到了良好的分类结果。最后,通过对分类结果的分析,获得了各协议的“指纹”。本文的实验结果表明:基于高斯混合模型的极大似然分类器对于区分SSH隧道加密流量具有良好的效果。在我们的实验环境里,四种协议的正确分类结果都在百分之八十五以上,对于SMTP,接近百分之百。