基于hadoop的APT建模与流量预处理技术研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:xamalong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高级持续性威胁(APT)是指精通复杂技术的入侵者利用多种入侵向量(如网络、物理和欺诈),借助丰富资源创建机会实现自己目的的行为。近年来,APT事件频频发生,例如RSA SecurID事件、“Night Dragon”事件等等,对企业跟社会造成很大的威胁。因此,APT检测技术的研究势在必行,对APT检测技术进行研究是现在网络信息安全领域非常关键的一个研究点。本文对典型的APT入侵案例进行建模分析,设计了典型APT入侵—“Night Dragon”的类图、顺序图和活动图等内容,在此基础上,分析了APT入侵行为的一般性规律和特点,并将其与传统的黑客入侵行为进行对比。该部分研究结果表明,APT入侵行为具有持续时间长、隐蔽性高的特性,对检测数据来源的时间跨度和空间覆盖程度以及检测算法的复杂性均提出了较高的要求。通过建模发现,对APT的检测势必需要对大量的网络流量数据进行分析,而由于原始网络流量的数据量过于庞大,对其进行分析需要大量的系统资源,同时分析效率也比较低。因此,为了能够更好的对APT进行检测,本文将对NetFlow流原始数据进行一定预处理以供APT分析检测所用。对一个内部网络的所有网络流量进行预处理,本文针对NetFlow流的预处理进行研究,主要包括将网络中所有的NetFlow流数据进行采集以及对其进行聚合处理以供分析。本文设计了一个可以高效采集NetFlow流的采集器,基于多链表队列的缓冲机制降低丢包率。同时由于繁忙网络中,NetFlow流的产生速度比较快,数量比较多,因此对其进行分析可以首先将它们按照一定规则进行聚合,减少数据的分析量,提高分析效率。在NetFlow流聚合上设计了基于时间的多重数据粒度以满足分析需求,再根据网络流量特点,设计出几种NetFlow流聚合策略,基于IP的Net Flow流聚合、基于端口的NetFlow流聚合以及基于协议的NetFlow流聚合。Hadoop是当前最为主流的大数据分析平台,它是分布式的处理架构。本文基于Hadoop大数据分析处理平台以及Map-Reduce分布式计算框架设计了NetFlow流聚合的系统结构以及Map()函数和Reduce()函数。最后,根据上面提出的基于Hadoop的NetFlow流预处理技术,对采集与聚合的研究进行实验分析。
其他文献
在当今信息爆炸的时代,人们面对着大量没有经过整理的原始数据时,将会茫然不知所措,而自动文摘技术能给人们提供更有力的信息加工技术和工具,但时下出现的自动文摘系统,特别
随着包括化学情报学、生物信息学、计算机视觉、视频索引、文本检索以及Web分析在内的广泛应用,图作为一种一般数据结构在复杂结构和它们之间相互作用建模中变得越来越重要。
笔式交互是多通道交互(Multi-Model Interaction,MMI)的一种重要形态,笔式交互允许用户通过自由勾画、手势等交互方式实现自然高效的交互,逐渐成为人机交互研究的热点。人们对笔
在信息技术飞速发展的今天,“数字城市”已成为当今信息时代城市发展的方向,是信息时代的城市形态。目前,世界各国都在积极开展“数字城市”研究和建设,我国许多城市也在进行
根据测评系统的功能用户可扩展和可定制的需求,结合基于组件的软件开发的方法,提出了测评系统的动态可重组的组件集成框架,支持无限级菜单自动生成和菜单名称自定义。设计了
随着计算机、通信和网络技术的发展,以及全球化、国际化给全世界带来的巨大而深远的影响,整个社会的信息化、数字化进程大大加快。高校在不同时期建立的封闭系统,形成了“信息孤
串匹配是计算机研究领域的一个经典问题,是网络内容分析系统的关键技术之一。随着互联网的普及和发展,海量信息的处理和新的应用需求对串匹配技术提出了新的挑战。在现实生活
当今科技飞速发展,信息化普及程度不断提高,云计算的日益普及使得越来越多的企业将数据放入远程云存储端。然而,现今市场上的云存储存在机密性、可用性、完整性方面的问题,公
近年来,电子商务的飞速发展,J2EE技术日益成熟,J2EE平台成为当今电子商务的最佳解决方案。重量级的J2EE框架暴露的缺点越来越明显,轻量级J2EE框架风头正劲,然而轻量级框架种
当前,机器人已广泛应用在工业领域,并逐步向家用、服务业、军事等领域扩展。但是在向多领域深层次的扩展过程中,机器人技术的研究与发展面临着巨大的挑战。尤其是在具有多个