基于hadoop的APT建模与流量预处理技术研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：xamalong

【摘要】

：

高级持续性威胁(APT)是指精通复杂技术的入侵者利用多种入侵向量(如网络、物理和欺诈),借助丰富资源创建机会实现自己目的的行为。近年来,APT事件频频发生,例如RSA SecurID事

【作者】

：

董彬

【机构】

：

国防科学技术大学

【出处】

：

国防科学技术大学

【发表日期】

：

2015年期

【关键词】

：

APT UML建模 NetFlow Hadoop 采集聚合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高级持续性威胁(APT)是指精通复杂技术的入侵者利用多种入侵向量(如网络、物理和欺诈),借助丰富资源创建机会实现自己目的的行为。近年来,APT事件频频发生,例如RSA SecurID事件、“Night Dragon”事件等等,对企业跟社会造成很大的威胁。因此,APT检测技术的研究势在必行,对APT检测技术进行研究是现在网络信息安全领域非常关键的一个研究点。本文对典型的APT入侵案例进行建模分析,设计了典型APT入侵—“Night Dragon”的类图、顺序图和活动图等内容,在此基础上,分析了APT入侵行为的一般性规律和特点,并将其与传统的黑客入侵行为进行对比。该部分研究结果表明,APT入侵行为具有持续时间长、隐蔽性高的特性,对检测数据来源的时间跨度和空间覆盖程度以及检测算法的复杂性均提出了较高的要求。通过建模发现,对APT的检测势必需要对大量的网络流量数据进行分析,而由于原始网络流量的数据量过于庞大,对其进行分析需要大量的系统资源,同时分析效率也比较低。因此,为了能够更好的对APT进行检测,本文将对NetFlow流原始数据进行一定预处理以供APT分析检测所用。对一个内部网络的所有网络流量进行预处理,本文针对NetFlow流的预处理进行研究,主要包括将网络中所有的NetFlow流数据进行采集以及对其进行聚合处理以供分析。本文设计了一个可以高效采集NetFlow流的采集器,基于多链表队列的缓冲机制降低丢包率。同时由于繁忙网络中,NetFlow流的产生速度比较快,数量比较多,因此对其进行分析可以首先将它们按照一定规则进行聚合,减少数据的分析量,提高分析效率。在NetFlow流聚合上设计了基于时间的多重数据粒度以满足分析需求,再根据网络流量特点,设计出几种NetFlow流聚合策略,基于IP的Net Flow流聚合、基于端口的NetFlow流聚合以及基于协议的NetFlow流聚合。Hadoop是当前最为主流的大数据分析平台,它是分布式的处理架构。本文基于Hadoop大数据分析处理平台以及Map-Reduce分布式计算框架设计了NetFlow流聚合的系统结构以及Map()函数和Reduce()函数。最后,根据上面提出的基于Hadoop的NetFlow流预处理技术,对采集与聚合的研究进行实验分析。

其他文献

摘录式单文档中文自动文摘系统的研究与实现

在当今信息爆炸的时代,人们面对着大量没有经过整理的原始数据时,将会茫然不知所措,而自动文摘技术能给人们提供更有力的信息加工技术和工具,但时下出现的自动文摘系统,特别

学位

自动文摘向量空间模型朴素贝叶斯

基于尝试优先策略的频繁导出子图挖掘算法

随着包括化学情报学、生物信息学、计算机视觉、视频索引、文本检索以及Web分析在内的广泛应用,图作为一种一般数据结构在复杂结构和它们之间相互作用建模中变得越来越重要。

学位

图挖掘频繁导出子图图同构数据挖掘图论深度优先策略

基于笔画距离的手写文档检索算法的研究

笔式交互是多通道交互（Multi-Model Interaction,MMI）的一种重要形态，笔式交互允许用户通过自由勾画、手势等交互方式实现自然高效的交互，逐渐成为人机交互研究的热点。人们对笔

学位

笔画距离手写文档检索智能人机交互归一化预处理最小近邻优先

基于SOA的数字城市信息交换平台研究

在信息技术飞速发展的今天,“数字城市”已成为当今信息时代城市发展的方向,是信息时代的城市形态。目前,世界各国都在积极开展“数字城市”研究和建设,我国许多城市也在进行

学位

信息交换信息共享数字城市面向服务的架构Web服务

动态可重组的组件集成框架研究与实现

根据测评系统的功能用户可扩展和可定制的需求,结合基于组件的软件开发的方法,提出了测评系统的动态可重组的组件集成框架,支持无限级菜单自动生成和菜单名称自定义。设计了

学位

组件集成测评系统无限可扩展软件可定制

数字化校园建设中异构数据集成技术的研究

随着计算机、通信和网络技术的发展，以及全球化、国际化给全世界带来的巨大而深远的影响，整个社会的信息化、数字化进程大大加快。高校在不同时期建立的封闭系统，形成了“信息孤

学位

数字化校园信息系统XML技术异构数据集成技术

基于GPU并行串匹配算法的研究

串匹配是计算机研究领域的一个经典问题,是网络内容分析系统的关键技术之一。随着互联网的普及和发展,海量信息的处理和新的应用需求对串匹配技术提出了新的挑战。在现实生活

学位

统一计算设备架构单指令多线程并行串匹配算法

多云存储网关可靠性技术研究

当今科技飞速发展,信息化普及程度不断提高,云计算的日益普及使得越来越多的企业将数据放入远程云存储端。然而,现今市场上的云存储存在机密性、可用性、完整性方面的问题,公

学位

云存储云网关数据安全多云存储

基于J2EE多层架构技术的电子商务研究与应用

近年来,电子商务的飞速发展,J2EE技术日益成熟,J2EE平台成为当今电子商务的最佳解决方案。重量级的J2EE框架暴露的缺点越来越明显,轻量级J2EE框架风头正劲,然而轻量级框架种

学位

多层架构电子商务关系数据库WEB应用开发

机器人分布计算框架中的实时性保证机制的研究与实现

当前,机器人已广泛应用在工业领域,并逐步向家用、服务业、军事等领域扩展。但是在向多领域深层次的扩展过程中,机器人技术的研究与发展面临着巨大的挑战。尤其是在具有多个

学位

机器人分布计算框架ROSDDS实时性中间件

基于hadoop的APT建模与流量预处理技术研究与实现

与本文相关的学术论文