基于网络流行为的网络流分类技术的研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:sjty2j
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的迅猛发展,极大地改变了人们的生活,新闻浏览器、网上购物软件、电子商务、视频会议、聊天工具等各种网络应用不断涌现。随着大量的新型网络应用出现,海量的数据在互联网上飞速传输,尽可能准确快速地识别网络应用类型,从而过滤掉非法的网络APP的流量,控制某些大数据网络APP的传输比例和速率,确保关键性业务的正常运行,及深度优化其关键业务的服务质量,对网络的控制和管理起到了至关重要作用。  当前网络环境下许多新型网络应用迅猛发展,而相当一部分的网络新应用采用的是随机端口,这使得基于网络端口的网络流量分类方法严重失效,深度包检测(DPI)方法尽管相对于其他方法,在准确率方面有较高的提升,但是特征码的匹配采用的是字符串或者正则表达式的形式,使得在匹配过程中花费时间很长,并且对于载荷特征库有很高的更新维护成本。在当今超大数据流量的网络环境下DPI方法很难适应。而基于网络流行为的网络流量分类方法只需要得到流的基本行为特征信息,执行效率相对有所提高,成为网络流量分类技术发展的新趋势。基于网络流行为的识别方法需要一个前提假设,就是属于同一个应用类别的对象存在一组相对稳定的特征结构,该特征可以是与应用类别相关的任何属性信息。  本文从不同角度观察分析了网络流的行为统计特征,利用这些行为特征和数据挖掘算法有效区分不同应用类型的网络流,主要工作分为以下四个部分:  首先,从网络流的行为统计特征出发,针对传统的基于有监督机器学习的分类方法对所有应用使用相同的特征使得某些特征对一种或几种应用类型有区分性,而对其他应用类型的网络流分类产生干扰等问题,提出采用基于子空间聚类算法的网络流分类方法,该方法可以识别新出现的未知应用。  其次,研究了网络流中数据连接之间的关系,用实验验证了链路相似性原理的存在,并提出了基于链路相似性的网络流量识别方法。该方法只使用网络流的节点信息,不依赖于载荷信息。  最后,研究了网络流的交互行为,发现P2P网络存在的特殊的交互模式,将网络流之间的交互特点通过图度量的形式抽象出来,提出基于网络流行为统计特征和图模型特征相结合的P2P流量识别方法。
其他文献
在分布式网络环境中,跨域认证大都采用基于Kerberos、PKI、IBC等的认证方案,其中具有代表性的方案之一是基于对称密码体制的Kerberos域内及域间认证模式。Kerberos协议是一种
随着计算机应用技术的迅速发展,人们对高效优化技术和智能计算技术提出了更高更新的要求,并用于求解各种工程问题优化解的应用技术,在诸多工程领域得到普遍的应用。鉴于实际
近年来,对于事件的研究一直以来深受学术界的高度重视,其中,从海量文本中进行事件抽取,从而获取人们感兴趣的信息和数据是大数据时代亟待解决的关键技术。事件抽取是信息抽取的重
企业应用集成EAI将企业遗留和新建的信息系统整合起来,工作流管理是整合这些系统的关键技术之一。工作流管理技术在企业应用集成EAI中将不同系统组织协调起来形成协作的工作
随着电信技术的迅速发展,网络的规模越来越庞大,而且网络的种类和需求也越来越多,并且网络都伴随着大量的数据,需要采用关系型数据库来存放数据,由于关系型数据模型和面向对
所谓信息推送(PUSH)技术服务,是相对于传统的第二代浏览器核心技术服务而言的。两者之间最大的不同是用户和信息之间的关系,信息拉取(PULL)服务是在“拉”的技术作用下“用户
华北落叶松是华北地区主要造林树种,具有速生、丰产、材质好等特点。但在其生长规律的研究中,由于周期较长,林木形态结构复杂,环境条件难以控制,表现为显著的区域性和时空变
随着Internet的快速发展和广泛应用,如何合理地规划网络建设,为网络使用者提供更加人性化的服务是目前的一个重要的研究方向。通过网络使用挖掘分析用户的浏览行为可以为页面
基于图像的三维重建需要以三维几何实体为模型,通过各种变换、裁剪和消隐等操作来确定场景的外观、场景的几何结构、光照模型、反射特性和动力学特性。单幅图像三维建模是基
XML已经逐渐成为Internet上数据的表示标准和信息交换基本语言,作为一种半结构化数据,它和传统数据库在数据模式上有所不同,因此不能直接使用传统的数据库技术进行处理。随着