论文部分内容阅读
DDoS攻击是一种攻击者控制大量的攻击机器,并向这些机器发出开始DoS攻击指令的分布式攻击方式。在最新的互联网安全报告中DDoS攻击仍然是当今网络的主要安全威胁之一。 目前由于Hadoop出现的时间较短,所以对其中的DDoS攻击检测相关的研究可以参考的资料较少。又由于Hadoop集群的任务交互,资源管理等依赖于计算机网络。而如果Hadoop集群中存在DDoS攻击就会造成网络的拥塞。若此时DDoS攻击的对象是针对Hadoop集群中的某台机器,则还可能造成该机器出现资源消耗,从而不能提供应有的计算能力。所以论文利用Hadoop集群的自身的特点研究在Hadoop集群中如何快速有效地检测出DDoS攻击,具有十分重要的意义。 论文首先给出了Hadoop集群中的网络流量数据包的捕获方案,其中,制定了不同数据捕获服务器上网络流量的捕获规则、丢弃策略、预处理和上传至HDFS的程序。之后分析了几种常见的DDoS攻击检测算法的优劣,从中选取了两种性能较好的算法,朴素贝叶斯和均值方差算法实现对Hadoop环境下DDoS攻击检测。由于在均值方差算法中IP包的统计工作量大,论文对该算法中IP包统计的过程利用Map/Reduce进行了实现。实际运行算法表明Map/Reduce后的算法在数据规模达到一定量之后明显好于原有算法。 最后,论文通过搭建Hadoop集群以及在集群中部署攻击和DDoS检测算法,实现了Hadoop中DDoS攻击检测方法的研究。实验表明论文提出的检测方法可以很好的检测出Hadoop集群中模拟存在的DDoS攻击。对促进Hadoop中的DDoS攻击研究具有良好的意义和价值。