论文部分内容阅读
P2P技术使当今的互联网发生了日新月异的变化,它改变了以服务器为中心的传统网络模式,提供了一种全新的获取资源的方式,得到了广泛应用。然而,P2P应用却带来了网络流量的急剧增长,造成了网络带宽的严重占用,对其他网络业务的服务质量造成极大的影响,因此如何有效地对这些流量进行准确的分类识别是当前研究的一个热点问题。论文研究了机器学习的基本原理和方法,重点讨论了支持向量机的原理和分类方法,分析了网络流量和P2P网络流量的基本分类方法,给出了P2P网络流程的行为特征和基于行为特征和支持向量机的P2P网络流量分类模型,利用P2P应用流量样本数据和LIBSVM,对分类模型进行了仿真。论文的主要工作如下:(1)研究了机器学习的基本原理和方法,重点讨论了支持向量机的原理和分类方法。讨论了朴素贝叶斯分类方法、决策树分类方法、聚类分类方法和神经网络分类方法,分析了基于端口的P2P流量分类方法、基于深层数据包检测的P2P流量分类方法和基于行为特征的P2P流量分类方法。(2)给出了P2P网络流量的行为特征和基于行为特征与支持向量机的P2P网络流量分类模型。分析了常见的几种P2P网络应用的流量行为特征,从P2P应用的功能特征、数据流特征和数据包特征三个方面给出了行为特征的定义,给出了流量行为特征检测模型和检测算法。(3)结合支持向量机方法和行为特征,给出了一种基于行为特征的P2P网络流量自学习分类模型。给出了SVM的核函数和参数,设计了基于SVM的P2P流量分类模型。(4)基于LIBSVM和P2P流量样本数据,对分类模型进行了仿真,对其性能进行了讨论分析。