论文部分内容阅读
入侵检测系统是网络安全的重要组成部分,入侵检测技术在保护互联网安全以及国家安全战略等领域具有重要的意义。作为一种动态安全技术,它可以及时发现并拦截非法入侵行为,保护正常网民免受来自黑客的骚扰威胁。然而,传统的入侵检测系统无法识别新型网络入侵,例如零日攻击等。并且传统的入侵检测系统检测出的准确率并不是很高,这就导致会出现大量的误报,但这些其实是正常或合理使用计算机产生的信息。大量的误报会增加管理人员的劳动量,从而可能导致真正关键的安全事件被忽略。因此,人们迫切需要研究一种具有更高准确率和更高效率的新型入侵检测系统。机器学习作为近几年呈现爆发式增长的技术,鉴于能够显著提高入侵检测系统的准确率,减小误报率,并且能通过自我训练学习,检测出新出现的入侵,被越来越多的应用在入侵检测中。本文针对以上问题,并结合机器学习方法,提出了一种混合的入侵检测分类算法,来提高入侵检测的准确率,并通过构建分布式入侵检测系统来提高入侵检测的效率。本文主要的研究成果与创新点如下:(1)提出结合Fisher Score和支持向量机的特征选择算法,通过使用Fisher Score对样本集特征评分,并使用支持向量机中的信息熵特性测试评分准确度,该方法确保了在特征排序的计算过程中优先保持最优化特征子集不变。(2)提出基于密度峰值最近邻的入侵检测算法,通过使用基于密度峰值聚类算法的密度公式,将一个可调控的阈值加入到密度公式中,保证了密度在任何场景下都为最优。使用基于密度的加权最近邻算法进行入侵检测分类,大大提高了入侵检测的准确率。(3)提出基于分布式的入侵检测系统模型,将原有测试样本集和密度峰值最近邻算法放在Hadoop集群上进行分布式运行,显著缩短了入侵检测系统的执行时间,提高了入侵检测的效率。