论文部分内容阅读
近年来,随着宽带技术和无线移动通信技术的高速发展,互联网业务正经历着空前的发展高峰,网络应用业务类型更是逐渐多样化,与此同时网络流量的测量与分析也越来越备受关注。在日常网络管理维护工作中,网络服务提供商(ISP)和网络管理员需要能够识别流经网络的流量类型并由此进行网络基础设施规划和网络安全监管,因此及时准确的识别网络流量类型具有重要的意义。
传统上的流量识别技术主要有四种:基于端口号的识别、基于深度包检测技术的识别、基于流统计特征的流量分类识别和基于社会行为的识别,其中基于深度包检测技术的流量识别方法是目前最常用和最准确的方法,广泛应用于当前的网络运营管理工作中。基于深度包检测技术的流量识别的关键和难点在于维护一个完整准确的网络应用协议特征库,当前特征库的建立与维护还很大程度上依赖于特征签名提取人员的经验并耗费大量的人力物力。因此,特征签名自动提取技术的研究逐步成为学术界和工业界研究的热点之一。
本论文针对国内外现有的特征签名自动提取过程进行了总结归纳,通过对当前常见网络应用协议及其负载进行研究,并借鉴蠕虫检测领域的研究成果,提出了一套网络应用协议特征签名自动提取过程,涉及了纯净流提取、数据预处理、特征提取算法、特征后期处理以及验证过程,并针对特征签名提取算法改进和特征签名的去噪提纯过程进行了深入研究与实现。