论文部分内容阅读
网络技术迅猛发展,各种新型网络应用越来越丰富,而由此导致的网络拥塞,网络安全和服务质量等问题也不断涌现。因此,通过网络行为分析,了解网络应用分布对网络资源的合理规划和分配有着重要意义。而基于Netflow网络流量分析技术作为当今进行网络流量监控与分析的主流技术,已成为研究的焦点。 本文首先对NetFlow技术进行了详细介绍,分析了其数据格式,工作原理及相关应用。同时对比和总结了网络流量分析相关技术的优缺点,针对当前协议识别技术大多是基于端口号进行应用协议识别,具有不准确性的问题,提出了一种增强的NetFlow数据采集方法,该方法引入了深度包检测技术,利用NetFlow V5数据格式存储数据流,在协议匹配过程中动态标识未被收录到特征规则集中的应用协议,并对捕获到的未知协议类型的流分组,为进一步提取该应用协议的特征字符扩大特征规则集提供数据支持,从而增强了应用协议分析的准确性和可扩展性。 其次,本文加入了对web站点访问数据的采集与动态存储,通过捕获DNS数据包,提取DNS响应包中的IP/域名信息并存入数据库,并采用定期转存数据的方式来动态维护缓存预分配的问题,为分析用户访问站点的行为习惯提供了有力的数据支撑。 最后,在Linux平台下设计并实现了此增强的NetFlow数据采集方法,同时通过实验分析验证了该方法的可行性和有效性。