论文部分内容阅读
互联网使用的普及虽然给人们带来了便利,但也同时带来了安全隐患。网络入侵数据的攻击可能会造成隐私泄露、系统瘫痪等重大问题。传统的网络安全防御技术多为被动防御机制,并不能适应黑客技术日渐猖獗的今天。入侵检测系统(Intrusion Detection System,IDS)及其相关技术是一种主动的、新兴的防御技术,因此得到了业界的大量关注。近些年,随着大数据时代的到来,机器学习技术发展迅猛。研究表明,将机器学习技术用于入侵检测是完全可行的。不仅如此,基于机器学习的入侵检测还具有智能化、灵活化等优点,能有效地解决传统入侵检测技术存在的方法僵化、检测率低等问题。因此,本文着重对基于机器学习的入侵检测技术展开了研究。入侵数据具有一些特性,如攻击数据类型多、存在稀疏攻击、存在未知攻击等。这些特性会影响到检测的准确率。传统的基于机器学习的入侵检测往往仅考虑采用单一算法对入侵数据进行识别,这样并不能很好地解决以上问题。如何设计一个好的入侵检测框架,从而能灵活地、可拓展地将不同机器学习技术有机结合是一个值得思考的问题。本文着重考虑的就是设计这样一个通用的入侵检测框架,以提高入侵检测的各项性能。本文的主要工作及创新点有:一、提出层次化、定制化的HMLD入侵检测框架,该框架由MH-DE模块、MH-ML模块和MEM模块共同组成,可以针对不同类型攻击采用不同的建模方法,提高检测性能;二、提出Clussifilter机器学习算法框架,并将其作为建模算法融入HMLD入侵检测框架中;三、优化整合经典入侵检测数据集KDDCUP99数据集并形成新的数据集KDD-I和KDD-II,新数据集去除了大量冗余数据,数据更均衡,更适用于入侵检测建模工作。本文将HMLD入侵检测框架作用于KDDCUP99数据集上,并对其进行了算法评估和参数选择。经验证,HMLD在KDDCUP99数据集上可以得到96.70%的准确率,较以往有较大提高。