论文部分内容阅读
随着互联网近年来的不断普及和发展,新型的网络业务层出不穷。然而,网络业务的增长给网络流的分类和管理工作带来了极大的困难。多媒体业务(如音频业务、视频业务、网页浏览等)作为互联网业务中最重要的组成部分之一,占据着最大一部分的网络流量。因此,对多媒体业务的流分类是一个重要的研究内容,有助于网络业务提供商(ISP,Internet Service Provider)为用户分配合适的网络资源,保障业务的服务质量。本文主要针对6种多媒体业务进行了细粒度的分析:在线音频类业务(即时语音通信和网络音乐)、在线视频类业务(直播和非直播)和网页浏览(搜索引擎和网络新闻业务)。本文对上述多媒体业务进行QoS(Quality of Service)特征的研究,并对这些业务的流样本进行了建模工作。具体研究工作如下:针对传统高斯混合模型(GMM,Gaussian mixture model)容易受到数据样本边缘值和离群样本的影响,本文用t分布混合模型(TMM,student’s t-distribution mixture model)替代原有的高斯混合模型,并使用EM(Expectation Maximization)算法对6种多媒体业务进行了建模工作。之后,提出了有限t分布混合模型(LTMM,Limited student’s t-distribution mixture model)。该模型可以降低EM算法的迭代次数,有效减少建模时间。此外,本文从理论和实验的角度将提出的混合模型与传统的K-Means和高斯混合模型进行了复杂度和分类准确度的对比,从而验证了两种模型的合理性。本文结合两种提出的混合模型,使用改进的半监督流分类方法对多媒体业务进行了分类工作。该方法可以分为数据预处理、数据建模以及数据分类三个部分。本文对该方法的聚类中心、细分类算法等内容进行了深入地探讨。实验结果表明,使用本文的半监督流分类方法对于多媒体业务可以获得较高的分类准确度。