论文部分内容阅读
随着互联网的普及和流媒体技术的发展,网络中各种各样的应用层出不穷。与此同时,网络视频业务流量的增长也引起了人们的极大关注。众所周知,视频业务数据传输量大,对网络带宽、时延等要求较高,并且不同类型网络视频应用有着不同的QoS需求,对网络环境的有效管理造成较大的影响。为了有效地管理网络环境、高效地分配网络资源以及保证不同视频应用的QoS需求,准确的网络业务流分类相当重要,尤其是对网络视频业务的分类。因此,网络业务流分类问题是近年来研究的热点。本文针对六种典型的网络视频业务进行研究,包括非对称标清视频、非对称高清视频、HTTP下载视频、QQ聊天视频、xunlei下载视频和网络在线直播Sopcast。主要关注网络业务流分类中的特征选取和识别方案的改进。主要工作如下:不同的网络视频业务具有不同的能够反映其本质属性的统计特征。如何找到该本质特征是提高基于流统计特征的机器学习算法性能的关键。因此,本文致力于寻找能够较好区分网络视频业务的统计特征。通过对获取的多媒体视频流数据进行深入的统计分析和数据挖掘,得到具有较好区分效果的业务流QoS相关特征组合(例如:包大小的信息熵、下上行字节数之比等),并验证了这些特征在区分典型网络视频应用中的有效性。针对网络视频应用的多样性,以及它们对QoS需求的差异性,有必要对网络视频应用进行更细粒度的划分。不同的网络视频业务具有不同的QoS相关的统计特征,特定的统计特征适合于区分特定的业务,即不可能用某个特征将所有的视频应用都区分开。随着需要区分的业务类别数的增多,所有分类算法的分类性能都会降低,即很难一次性将所有的应用区分开。因此,本文提出了一种基于多级聚类的网络视频流识别方案。本方案逐级地对网络视频流进行分类,并在每一级分类中采用不同的统计特征组合,通过分类实验与现有的方法进行比较。实验结果表明,本文提出的多级聚类网络视频流识别方案能够取得更好的分类准确率。