论文部分内容阅读
随着网络和流媒体技术的发展,网络视频业务的流量正在迅猛增长。网络视频业务传输的数据量大、实时性要求高,这些因素对网络管理造成了较大影响,为了更好地控制和管理网络流量以及保障网络视频的QoS(Quality of Service),对网络视频业务进行有效地分类是非常有必要的。而在流量识别和分类中,进行特征分析、获取较好的特征是实现高效分类的一个关键点。本文从包大小分布、速率、IP的交替、下行和上行的字节数之比、子流片段的数目、平均包到达时间间隔特征入手,对高清、标清两种HTTP流媒体视频、HTTP下载、以Sopcast为代表的在线网络电视直播、QQ视频、迅雷等6种网络视频业务进行特征分析,并选取有效特征进行识别和分类。通过对不同时间段数据包大小分布的分析,发现各类业务都具有明显的包大小分布,且分布较为稳定。通过计算包大小分布之间的Hellinger距离,发现QQ视频和其他几类业务分布的差异最大,HTTP下载、高清、标清三类业务的包大小分布相似。在下行和上行的字节数之比这一特征上,标清和其余几类的差异最为明显,HTTP下载和高清比较相似,二者都具有较大的比值,Sopcast和QQ视频的比值均较小。迅雷则拥有最多的子流片段数目,6类业务中QQ视频和HTTP下载具有较少的子流片段数目。因此,结合利用下行和上行字节数之比、子流片段的数目两个特征可以实现这6类视频业务的识别和分类。采用支持向量机方法(Support Vector Machine,SVM)对这两个特征的分类效果进行了实验验证,获得了较高的分类准确率。