面向应用特征的流量分类方法的研究与实现

来源 :东南大学 | 被引量 : 4次 | 上传用户:wolaile999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展,网络应用类型不断增多,网络流量呈现爆发式增长,不同类型的应用在对网络资源的需求和使用方面呈现出较大差异。为了更好地保障网络应用的QoS需求,实现对应用业务的精细化管理,提高网络资源利用率,需要对网络流量进行分类和识别。然而,现有流量分类方法一方面大多以网络应用协议特征为分类依据,无法反映应用流量对网络资源的使用情况以及应用流量QoS需求的满足情况,另一方面在面对大规模流量数据时,受限于平台的计算能力和存储能力,导致识别训练开销大、速度慢等问题。因此,本硕士论文针对现有网络流量分类中存在的上述问题,从网络应用对网络资源使用情况的角度,对面向网络应用特征的流量分类方法进行研究,主要工作包括以下几个方面:(1)分析现有应用流量QoS需求以及对网络资源的使用情况,将网络应用流量特征引入到流量分类领域,建立面向网络应用流量特征的流量分类模型,用于刻画动态应用类型行为对网络状态的影响,从而为保障业务的QoS需求,实现对应用业务的精细化管理提供基础。(2)针对流量特征种类繁多,导致训练时间开销过大等不足,提出一种基于类别相关的网络应用流量特征降维方法。该方法首先基于类别相关性确定对流量分类影响显著的流量特征,然后计算每两个特征间的冗余性,去除对流量分类影响小且冗余性高的流量特征,从而获得分类特征集,有助于为后续样本训练构造样本集,达到减少训练时间开销的目的。(3)面对大规模流量,针对现有流量分类方法大多采用单机分类技术,存在训练时间长,存储能力有限等不足,提出一种基于网络应用流量特征的并行流量分类方法。该方法首先将重取样与欠取样方式相结合构造样本子集,划分若干个包含网络应用流量特征的样本子集,然后将并行化思想引入到流量分类中,使用Spark计算框架分别对样本子集构造成员分类器。最后在分类阶段成员分类器根据投票选举对网络流量进行分类。该方法借助于Spark计算框架在保证分类准确率的同时能有效的减少样本训练的时间开销。综上所述,本论文对网络的流量分类问题进行了深入的研究,建立了一种面向网络应用流量特征的流量分类模型,进而分别提出了基于类别相关的网络应用流量特征降维方法和基于网络应用流量特征的并行流量分类方法,设计相应的仿真实验以及实现原型系统,验证了本文研究成果的可行性与有效性。
其他文献
基于视频的智能监控系统是维护社会安全、影响生产生活、关系学术研究的重要课题之一。首先,本文详细阐述了基于视频的前景检测技术,指出现有混合高斯模型存在两个问题,一个
皮肤听声是一种解决耳聋患者听觉问题的新技术,基于皮肤听声技术的变压式皮肤听声器已经实现,但是由于目前研制的变压式皮肤听声器内置电路所采用的是模拟电子电路,在信号处理方
学位
无线局域网(WLAN)主要利用射频技术在空中传送和接收数据,尽可能减少有线连接的需要,并将数据的连通性和用户的移动性结合起来。然而,无线网络的灵活性是以增加安全性考虑为
随着3G网络的建设实施与发展,GSM网络的大规模建设已进入尾声,但GSM网络依靠自身的优势,未来几年内在移动通信行业中仍处于主导地位。目前,国内移动运营商要想提高行业内竞争力,不
学位
H.264/AVC是新一代的视频编码标准,具有压缩性能好,图像质量清晰和良好的网络交互性能等多种特性,因而受到了诸多科研机构及多媒体工业界的高度重视。在H.264/AVC标准中,码率
本文首先对当前IM的现状进行调查研究,通过即时消息的交流变得越来越流行,不管是国外的ICQ和MSN等,还是国内的QQ和飞信以及GOOGLE的GTALK等,人们的平常生活交流已经离不开他
在数据库应用系统中,加快数据查询的执行速度非常重要。主要的方法有两种,一种方法是对SQL查询语句进行优化,另一种方法则是采用物化视图技术。物化视图存储了视图的定义和预
现今是数据爆炸的时代,企业级系统中的用户和相应的权限多且复杂,需要采用基于角色的访问控制模型进行合适的管理。角色挖掘作为一种可以自动挖掘出潜在角色的方法而受到了广
双结构网络是以传统的TCP/IP网络为主结构,以此为基础添加了“广播和分布储存”的“播存结构”作为次级结构,用以缓解互联网中“信息过载”等问题。播存结构利用物理广播的辐
随着社会的快速发展,信息的传播越来越多、越来越快。Internet上的信息量更是呈爆炸式增长,以致目前网络带宽和缓存容量等硬件资源难以满足业务流增长的需求,由此引发网络拥塞。