基于机器学习的因特网流量分类研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:Y644900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因特网流量分类研究是众多因特网研究的基础,清楚地了解整个因特网的流量情况对于因特网流量建模、网络运行维护管理、网络安全及流量工程等均具有重要意义。在P2P应用逐渐普及的今天,基于端口和载荷的传统流量分类方法逐渐凸现出局限性,迫切需要一种新型的、有效的流量分类方法,为因特网业务的QoS保证、网络异常检测等提供支撑。 本文在参考国外优秀文献和最新研究成果的基础上,提出了两个基于机器学习的流量分类模型。首先,第一个分类模型引入整体学习和半监督学习,一定程度上弥补了单假设算法性能低下的缺陷,并且可以利用网络中容易可获取的未标记流量来改善分类器性能。其次,第二个分类模型引入整体学习和代价敏感学习,重点关注真正影响网络带宽的"大象"流量,提高分类的字节准确率,改善流量控制设备的性能。实验结果表明:两个分类模型相对以往文献中使用的流量分类模型,具有更好的性能。 本文在中山大学校园网主干的一条接入链路上设立监测点并进行双向的流量数据采集,然后对校园网中的流量进行分类,并深入讨论。与传统的流量分类方法不同,本文方法不需要通过端口或者载荷信息进行分类,而是采用独立于载荷的流量统计特征作为分类依据。本文中的一系列分析数据不但为因特网流量分类研究提供帮助,也为其它有关网络流量的研究提供了一定的事实依据。
其他文献
泛型程序设计是一种重要的程序设计风范,它强调使用概念进行程序设计,追求抽象和效率的和谐统一,以易扩展、易交互的方式表达算法、数据结构及其它软件概念的抽象表示和系统组织
近年来,油库进行信息化建设大大提高了生产及管理水平,取得了一定的管理效益和经济效益。但是由于客观原因所致,油库各自动化控制系统以及信息管理系统都是由不同厂家建设实施,并
随着企业对软件需求的不断增长,应用系统的功能越来越强大,软件的结构也越来越复杂。软件公司一方面需要实现这些复杂的功能,另一方面需要迅速地推出产品,以减少成本、应对激烈的
论文以国家科技支撑计划科研课题为背景,根据电子社区服务基础网络环境由广域网中的多个子网组成VPN网络的特点,设计并实现了一个电子社区VPN监测系统。本文所完成的主要工作
高光谱遥感数据因其包含着图像与光谱双重信息的特性被愈加广泛地应用在军事检测、环境保护和公共安全等方面。但由于自然界中空间及地物的复杂性,图像中的像元往往包含了较
高校教师课堂教学质量评价系统是适用于高等院校教师课堂教学质量管理及监控的网络软件。本系统融合了长期从事管理软件开发者的丰富经验与先进技术,采用领先的B/S(浏览器/服
超点是指在一段时间内链接了大量源主机(目的主机)的目的主机(源主机)。长流是指在一段时间内拥有大量报文的流。随着互联网的发展,网络入侵事件频繁发生,如蠕虫传播、分布式
计算机三维颅面复原技术是以颅骨与面部之间的相互关系为科学依据来生成三维人脸表面模型,它可广泛应用于考古、刑侦等领域,成为计算机图形学领域的一个研究热点。本文在综述
统计模式识别方法现在已经成功地被应用到了很多目标识别的问题当中,其中一个经典的例子就是应用于人脸识别,这也是模式识别领域的一个重要研究方向。其中基于主成分分析(PCA)
学位
产品数据管理(PDM)是一门在产品开发环境中成长和发展起来的新技术,用于管理所有与产品相关的信息和过程。它能够有力地促进新产品的设计和开发,缩短产品上市的时间,是推动企业