具有规模适应性的互联网流量识别方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:zsj_bj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网流量识别是互联网流量测量领域的研究热点问题之一。以P2P流量为主要对象的流量识别、管理已经成为学术界、网络工程界、国家有关部门普遍关心的问题。高效、准确地识别互联网流量对于分析网络发展趋势、提供服务质量保证、动态访问控制、网络合法管理、异常行为检测等都有很重要的现实意义。传统的以知名端口和应用层载荷特征码为基础的流量识别方法难以应对端口伪装、端口随机选择和应用层数据加密等反监测技术趋势。基于应用行为和流特征的方法已经受到研究人员关注,但识别准确率、实时处理能力、自动学习能力和新应用发现能力等都是需要面对的挑战。具有规模适应性的互联网流量识别方法的研究目标是面向不同网络规模、不同宏观程度以及不同识别粒度的分析需求,研究在不同层次和不同范围内对互联网传输的内容进行区分,对互联网应用行为进行分析的有效方法和组织方式。并从智能学习特性、在线实时处理能力、混合分类实施方式以及不同范围内的分布式处理方法等方面提出了新的目标。论文基于此研究面向单点、有限网络规模和互联网范围的流量识别和行为分析方法。针对上述关键性问题展开研究,主要贡献和创新包括以下几点:(1)提出基于数据引力和细分识别空间理论的半监督学习(DGFDRS-SSL)模型,在此基础上研究基于流统计特征的机器学习流量识别方法。把样本空间的数据点视为质量点,定义数据点之间的欧式距离为样本距离,借用万有引力定律提出数据空间中的数据引力(DG)理论,基于数据引力实施样本聚类。提出细分识别空间(FDRS)理论,对分类识别空间进行不同维度和细度的划分,采用染色的方法对划分后的识别空间进行区分,形成一个具有细分特征的识别空间。数据样本聚类后把聚类结果映射到细分识别空间,在染色原则指导下根据有“标记”样本对识别空间染色得到半监督学习分类训练模型。把模型用于面向单点的流统计特征流量识别,克服了传统有导师学习方法需要大量有分类“标记”样本缺点,具有较高的性能和新应用发现的能力。(2)定义了互联网应用群体模型,提出面向有限网络规模的互联网应用群体发现和流量识别方法。分析互联网应用的特性,定义互联网中不同应用行为的主机连接特征图。结合社会群体概念和有限网络范围内的行为主机之间聚集、共享和连接特征,研究基于行为特征图的动态互联网应用群体生成和发现方法。从不同层次和位置收集具有不同方向属性的节点行为信息用于分析有限规模的网络行为。借助宏观的群体特征发现实施微观粒度的流量识别、端口伪装和跨协议传输行为发现。适于有限规模内具有分布式和协同特征的应用行为分析,不受易变易伪装特征的影响。(3)提出了面向互联网规模的自组织流量识别联盟模型。结合DHT(分布式哈希表)的优点,研究利用虚拟存储和相同前缀Hash技术实现索引资源本地存储的方法,设计改进的Chord覆盖网络路由算法,并基于此设计无中心的自组织互联网流量识别和行为分析联盟模型。具有本地流量识别和行为分析功能的节点在遵守联盟协议的条件下可以加入联盟,并在联盟成员之间协助流量识别和行为分析,共享流量特征、数据样本和识别经验。克服了传统方法只能在有限组织机构之间通过固定设备和协议的协助,可扩展性差和开放性不足等缺点。(4)提出并设计了一种获取有分类“标记”的真实网络流量数据样本的方法,结合网络处理器实现了流量样本采集平台。设计客户端,利用静态过滤监测机制,采用Hook方式监视本地应用程序的网络调用。根据发起网络流量的应用程序或进程识别应用,并把对应程序分类信息标签嵌入相应数据包的TOS标志位,实现互联网流量的真实分类“标记”,同时具有流量分类验证功能。在网关出口利用网络处理器的快速硬件匹配能力检测数据包TOS标志位,采集带分类“标记”的流量样本,预处理后发布使用,实用有效。(5)提出了一种基于机器学习的在线流量识别方法,并结合网络处理器实现1000Mbps有限线速处理目标。研究互联网流量的时序相关性特征,获取行为节点之间的前序流量信息后进行分类识别,随后利用得到的前序流的识别结果指导后续流识别和分类,并随时根据获取流特征的变化进行调整和修正。发挥IXP-2400网络处理器的高速并行处理特性和软计算理论的智能特性,实现基于网络处理器和服务器相结合的软、硬件混合的流量识别平台,具备1000Mbps的有限线速处理能力。使基于机器学习的流量识别方法具有一定的在线实时识别能力。
其他文献
经济的快速发展,推动了建筑事业的发展步伐,如何提高建筑设计中的建筑节能措施的应用效果,不仅是当今建筑企业适应和谐社会发展的需要,更是建筑企业提升自身竞争优势的关键,
财务报销对事业单位整体会计核算有较大的影响,一旦出现问题,将会使单位财务出现问题。虽然财务报销有着如此重要的作用,但是在很多事业单位中仍然存在着种种问题。笔者将在
国网巴林左旗供电公司以党建工作为引领,严履责、细管控、求实效,深入探索"党建+"实践思路,在乡镇供电所创新实施"2+2+2+N"党建工作模式,全面促进了党建工作与安全管理、配网
国网吉林桦甸市供电公司立足本公司客观条件,以满足职工需求为切入点扎实开展职工服务工作。要想为职工服务好,首先要了解职工真正需求。随着新生代职工不断涌现,职工的个性
党的十九大提出"培育具有全球竞争力的世界一流企业",没有一流的管理就没有一流的企业,建设世界一流企业必须加快提升企业管理水平。地市级电网企业深入贯彻党的十九大精神,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
针对潜射重型鱼雷在技术性能上的大幅提高和智能化作战的需要,在提出并分析鱼雷机动搜索概念和机动搜索时机的基础上,研究了远程重型鱼雷实现机动搜索在弥补发射平台目标定位
随着图像技术的广泛应用,图像的质量评估问题,即信息的可靠性问题,在自动化系统中的地位日益重要。全信息图像质量评估是针对目标原始图像和被测图像都已知时的被测图像评估。从历史发展角度系统地回顾了20世纪60年代以来全信息图像质量评估研究的发展历程和现状,并从算法的构成角度对代表性的全信息图像质量评估算法进行了分类与分析。由于图像质量评估函数的性能测定在其研究中具有重要的地位,对于图像质量评估函数的性能
中共十九大明确指出新时代我国经济已由高速增长阶段转向高质量发展阶段,由此经济高质量发展成为我国实务界和理论界关注和研究的热点问题。学者们主要从经济高质量发展的内
为了定量评价和探索提高网络中心战中的战场感知能力的途径,针对网络中心战的特点,运用集合论、信息论、图论等理论研究了战场感知能力的量化问题。首先分析了影响战场感知能力