论文部分内容阅读
目前,基于TCP/IP的互联网正在向纵深方向发展,新的应用模式和应用需求不断涌现。与互联网的飞速发展相比,网络行为方面的研究较少。互联网具有很强的社会性,广大用户对互联网有重大影响。如何认识这个系统的统计学特征,对互联网及其用户行为特征的研究,是网络规划、设计和管理的重要依据。P2P应用的飞速发展使其成为目前互联网中最重要的业务类型之一。但分布式系统非最优、不可控的缺点,使P2P技术本身潜在安全问题,以及对带宽资源的滥用,受到各个网络运营商的高度重视。对P2P业务流量进行识别和有效管控成为目前网络运行工作中的重点内容之本文的研究基于使用机器学习算法的P2P主机-连接两级分类器。在网络层和传输层,我们将TCP和UDP分开进行统计分析,改进流量统计方法,以规避TCP和UDP实现机制上的差异对流量参数的影响。在应用层的角度,我根据各类业务通信方式的特点,提出更能代表业务本质特征的流量参数。两级分类器的主机层统计局域网内主机的总体行为特征参数,连接层统计主机内个体连接的特征参数,使用BP神经网络分类器进行分类。本文使用识别代价参数,将业务识别误判率、漏判率整合为一个定量的识别效果评价参数。通过识别代价函数推导证明,主机行为分类器的性能指数比连接分类器的性能指数减一稍强的情况下,两级分类器可以获得更好的识别性能,并且具有更低的时间复杂度和空间复杂度。通过大量实验证明,二级分类器的性能指标远优于单级连接分类器,可以更好地应用于实时在线的网络流量分类。