论文部分内容阅读
近年来P2P软件发展迅速,随着计算机网络的广泛应用和多媒体资源的丰富,P2P技术被主要应用于文件(主要是大型的多媒体文件)共享方面。当前用于文件共享的P2P协议种类很多,在美国大量使用的是KaZaA,在欧洲存在大量用户的是eDonkey和WinMx,在中国使用最频繁的是BitTorrent和eDonkey;其它常用的P2P协议还有如FastTraek、eMule、Grokster、Groove、Gnutella等。P2P用户的总数庞大到数以百万计,占用的带宽资源也高达60%以上。如何应对P2P带来的网络带宽资源匮乏问题成为ISP目前最迫切解决的问题。
最早出现的P2P软件利用默认的端口号进行数据传输,所以最早根据端口号来识别P2P流量,但是随着P2P软件的发展,现在的P2P软件基本都可以实现动态端口传输,目前流行的是采用内容识别的技术,即深入数据包的应用层,将流量与协议特征进行匹配,这种方法精确度很高,但是受到非技术上的一些限制,无法识别未知协议内容的P2P流量。
本文中提出一个基于传输层行为特征识别P2P流量的方法,例如,从P2P网络的连接模式来考察P2P的行为特征,这种方法不依赖于数据内容,所以不受协议内容的限制。通过收集路由器上的NetFlow数据来分析传输层的行为,进而识别出P2P主机和流量。本文还设计了一个基于内容识别的系统用于比较两种方法的效果。