基于数据中心网络的异常流高效检测和流矩估算研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:f360358188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络流量测量是网络管理中的一个重要组成部分,在网络安全攻防领域具有重要的作用,诸如网络拥塞、DDOS攻击、蠕虫病毒等网络事件均可通过对网络流量的有效检测进识别。但随着网络数据的爆发式增长,以及网络传输速率的巨大提升,传统的网络流量检测方式面临着许多问题,在有限的存储空间下进行准确的流量统计成为一项挑战。而就数据中心这类特殊的网络来看,其除了会产生规模非常大的海量网络流量数据外,数据中心网络的流量分布特点也使得传统的流量检测方法具有极大的局限性。在互联网发展的早期,服务器主要用于对外提供服务,不同的服务业务又通过VLAN或安全区隔离成不同分区,所以这每一个分区都集中了该服务所需要的计算、存储等资源,不同分区之间有明显的界限,相互之间较难进行访问。所以传统的数据中心网络中,主要以客户端与服务器之间的南北向流量居多。在这种情况下,传统的网络流量检测方案往往是在数据中心网络的边界网关,或进出口交换机上部署相应的检测探针进行网络流的检测。而随着诸如大数据、云计算等高速流量网络应用的不断发展,传统的数据中心网络资源利用率低下的问题日益突出,为此出现了虚拟化、云计算管理等新技术,通过将各个分区中的资源进行池化,以达到充分利用网络中软硬件资源的目的。而在这个过程中往往涉及诸如虚拟机迁移、数据同步备份、协同计算等操作,这些操作极大的增加了数据中心网络内及数据中心之间的主机通讯,大幅度增加了数据中心网络的东西向流量。而传统的网络流量测量方案由于仅仅是把检测探针部署在网络出口边界上,所以只能够监听网络的南北向流量,无法满足对日益增长的东西向流量的检测需求,对于数据中心内部的网络,更是无法发现恶意的内网入侵,和网络故障等问题。即使是在数据中心网络中的关键节点部署硬件流量探针,也存在着硬件设备的部署成本较高,难以对全网进行部署的问题。所以就需要能够使用软件化,低成本的流量检测算法以部署到数据中心网络中的多核主机上,让数据中心主机在进行正常数据处理的同时,实现对网络流量的高速精确的测量。为此不少专家学者对网络流算法进行了深入的研究,并取得了丰富的研究成果,出现了基于数据包采样的测量算法,基于流的计数器的测量算法以及基于流的Sketch的测量算法这三大类数据流测量算法。而在这主流的三大类网络流算法中,以CountMin Sketch与Count Sketch为代表的、概要性计数的Sketch数据流算法由于能够能够充分地利用有限的内存资源,并提供较高的计算精度而备受关注,并被广泛应用于大数据,网络安全,流量工程等领域。虽然目前的大部分算法已经拥有不错的测量精度,但仍然存在着两大方面的问题,一是对于网络流数据的处理来说,这主流的三类算法各有利弊,即使是基于流的Sketch也面临着内存利用率不太高效,处理速度仍有提升空间的问题。二是对于网络中的各种突发事件,一般的网络流算法往往只能够提供非常有限的网络流度量信息,如果需要对多个网络事件进行检测将面临需要引入更多的数据流算法的问题。为此,本文主要探讨如何设计在数据中心这类高速网络环境中进行高效流量测量的通用算法,以已有的一些数据流算法为基础,首先提出了一种高度压缩的共享计数器结构CountMin virtual active counter(CM-VAC),以进一步适应有限存储空间与高速流量测量的需求,然后基于Univmon的论文思想进行改进并设计了本文的CMUnivmon算法以实现对网络流量的多个指标的检测,从而提升本文数据流算法的通用性。本文的主要贡献包括:(1)针对目前一些网络流算法的内存空间利用率低,处理速度仍可以进一步提升的问题,本文结合已有的 CountMin Sketch(CM)与 Virtual Active Counters(VAC)等算法,基于其中的关键技术设计实现了一种最小虚拟活跃计数器算法(CountMin virtual active counter,CM-VAC)。该算法通过将32位的计数器压缩到8位存储空间,并让多个流共享同一个计数器以减少算法所需要使用的内存空间。同时,算法概率性的更新计数器以及哈希函数值的分段使用也极大的提升了算法对网络流数据的插入与查询速率。(2)为了能够有效地检测出网络中层出不穷的异常流量事件,针对目前大部分网络流算法只能够聚焦于网络流量监测中的某一个测度的问题,本文在原有的Univmon算法结构上进行改进与设计,实现了一种内存空间十分紧凑的通用Sketch算法(Compressed memory Universal Monitoring,CMUnivmon)。该算法通过底层的 CM-VAC结构来统计网络中的整体流量信息,借助算法中原有的Heavy hitters堆作为热点过滤器从而进一步提升算法的插入速度与对Heavy hitters事件的检测精度。通过对不同流矩值的计算以给管理人员提供更多的数据流度量信息。(3)在理论分析的基础上,本文借助CAIDA真实的数据流trace信息对本文中提出的所有算法进行了性能测试,通过实验验证了本文算法的优越性。在文章的最后部分,本文基于所提出的通用流矩算法CMUnivmon,结合因特尔的DPDK开发套件,MySQL数据库与Flask网络框架设计了一个简单的基于数据中心主机的网络流量测量原型系统,通过搭建简单的流量仿真测试环境,说明本文提出的算法在真实网络环境中应用的可行性。
其他文献
目的:探讨高频重复经颅磁刺激(rT MS)对精神分裂症患者尼古丁渴求度的影响。方法:选取84例符合精神分裂症临床症状的患者作为研究对象,将其以区组随机化法分为研究组和对照组,各4
【正】 解释学,又译为释义学、诠释学或阐释学.广义地说,解释学是关于理解"本文"(Text)的理论.这里的"本文"可以宽泛地理解为一切以书面文字和口头语言表达中人类语义交往的
新课程改革下地理学科建设提出了“以学生发展为中心”的核心理念,强调学生在教育过程中的主体地位,而地理教材图像系统作为地理教学过程中充分渗透和培养学生地理综合思维的实体材料,其编写应当围绕学生的学科能力发展为核心。但当前关于地理教材图像系统的研究,存在中学生的主体地位不强、研究方法偏向于对图像系统的定性描述而非定量分析的问题。本研究在对湘教版地理必修二的图像系统进行综合评价并得出评价结果的基础上,提
目的:观察微创钢板接骨术(MIPO)治疗胫骨远端骨折的效果。方法:选取62例胫骨远端骨折患者作为研究对象,按照随机数字表法分为观察组32例、对照组30例。观察组实施MIPO治疗,对
漳州市博物馆依托"漳台族谱对接成果展",开展了卓有成效的涉台文化宣传。从中可以看出,博物馆在涉台文化宣传中具有文物资源优势、文化窗口优势和文化软传输优势,在涉台文化
为了保障移动Ad Hoc网络的服务质量(Quality of Service,QoS)需求,选择合适的QoS路由算法是需要研究的重要问题之一。但研究表明,多约束条件下的QoS组播路由问题属于多项式复
在现代医学技术突飞猛进和医疗保障体制改革的今天.人们对医院临床检验的质量越来越予以高度的重视.临床检验结果是医院的生存与发展的根本,其结果正确与否直接影响了对患者病情
泉州南外宗正司作为南宋外居宗室的管理机构,其所管理的皇族宗室群体,对泉州地方社会产生不容忽视的影响。本文通过史志文献的记载,梳理宗人入泉路线及时间,考订南外宗正司移
阿尔茨海默病(Alzheimer’s Disease,AD)和癫痫(epilepsy)都是神经内科常见的慢性疾病,其发病机制复杂,不仅严重侵害患者的身心健康,也给家庭和社会带来了沉重负担。两者在病
近年来随着信用债市场大量扩容,自2015年开始,公司债市场发行了大量“3+2”以及“2+1”期限结构的品种。而当前宏观经济环境不断强调“去杠杠、严监管”,这使得前期大量依赖信用债融资的企业陆续开始出现流动性问题。其中,民营企业上市公司出现大量的企业债违约,究其原因,大多是由于企业“过度投资”、“过度杠杆经营”所导致。一直以来,关联交易就是导致我国民营企业上市公司出现困境的一大重要因素。企业进行关联