论文部分内容阅读
当前网络视频业务已经成为网络的基础应用之一。基于P2P技术的多媒体业务是当前网络视频业务的重要组成部分。根据Cisco公司2011年的报告显示P2P流媒体业务正以48%的年增长率成为网络的第一大应用。随着P2P流媒体业务的发展,它占据了大量的带宽,影响其他业务应用,同时由于P2P技术的开放性与P2P节点的离散性,导致P2P流媒体难以管理,P2P视频内容泛滥。对P2P流媒体进行内容监管已经关系到运营商的发展存亡。P2P流媒体的内容监管离不开对P2P流媒体进行有效快速识别,因此对P2P流媒体的识别具有重要意义。本文依托国家863课题“三网融合下的统一安全管控网络”。针对P2P流媒体精确识别的需求,将P2P直播流与P2P点播流进行有效区分,提出了一种基于多特征联合的P2P流媒体类识别方法。在此基础上提出一种加速型SVM的P2P流媒体应用识别算法。将两种方法结合,并结合基于关联节点的识别方法,设计了一种P2P流媒体识别系统。并在工程上实现了该系统。主要工作如下:1将P2P直播流与P2P点播流区分,同时与P2P文件共享进行比较,分析了它们在行为特征、流量特征方面的不同,提取了7中有效的特征,并结合CART算法实现了P2P流媒体类的识别。实验结果表明:所提7个特征不仅能区分P2P流媒体与P2P文件共享流,还能将P2P流媒体中的直播流和点播流进行有效区分。此外将CART算法与常见的几种算法比较,综合时间和准确率,基于CART决策树的P2P流媒体识别算法性能最好。2在对P2P流媒体类识别研究的基础上,对提取的流量特征进一步细分,提出了可用于P2P流媒体应用识别的特征。并针对多分类SVM训练时间与识别时间较大的问题,提出了一种加速型SVM算法,在训练时SVM主要进行训练集约简,在识别时主要进行预识别。实验表明,加速型SVM比SVM具有较低的训练与识别时间。同时将它与Abacus方法进行比较,发现基于加速型SVM的P2P流媒体应用识别算法准确率高,时间开销小。3在以上两种方法的基础上,结合基于关联节点的P2P识别方法,设计实现了基于P2P超级节点匹配的P2P流媒体识别系统,并对系统进行了测试分析,测试结果表明:当采用基于CART决策树识别P2P流媒体流量时,其准确率达到了95%以上,当采用基于加速型SVM算法进行P2P流媒体应用识别时,其准确率为90%以上。同时网络中至少有25%的节点可通过关联节点的识别方法进行识别,加速P2P流媒体应用的识别。通过基于超级节点匹配的预识别和后面的机器学习识别方法,使系统达到了三网融合下的业务管控网络系统的研发需求。