论文部分内容阅读
随着计算机与网络信息系统的不断发展,基于互联网技术的业务呈爆发增长的趋势。对网络信息系统的防护,特别是针对敏感信息系统的保护,成为制约其进一步发展的主要瓶颈。防病毒软件、防火墙、入侵检测等技术的发展,从系统内部、网络边界以及行为检测等多个维度保护网络信息系统的安全。但是用户与系统行为的不确定性与复杂性,导致传统的入侵检测方法面临巨大挑战。随着人工智能技术的不断演进,针对数据挖掘与机器学习技术的入侵检测研究取得了显著成效,入侵检测技术在检测性能、准确率、误报率等指标方面得到了快速发展。但是近年来,相关研究工作逐步进入瓶颈期,急需一个新的研究视角,从而进一步提高系统性能。如何从复杂数据集中提取更具有代表性的属性特征从而更加准确刻画正常行为和入侵行为,成为当前基于机器学习的入侵检测方案的一个重要突破点。针对上述问题,本文设计了一种基于机器学习的面向特征表示方法的入侵检测系统。首先,该系统基于CANN架构,采用聚类中心和最邻近样本方法,使用基于快速搜索密度峰值的聚类算法提取数据集的聚类中心,并对聚类中心进行了重新定义,从而找出数据集中与给定数据样本隶属于同一聚类中心的最邻近样本。其次,通过计算数据集中给定数据样本与聚类中心的距离以及数据样本与同一集群中最邻近样本之间的距离之和,进而使用一个新的基于距离值的特征向量属性来表述各个数据点。最后,原始的多维特征数据集被转换成新的一维基于距离的特征数据集。该方法利用聚类中心和最邻近样本对不同类别的区分能力对测试数据进行分类分析,同时对数据进行降维,提高了检测效率。为论证所提方案的性能与可行性,本文进行了系列实验。实验结果表明,本文提出的基于CANN架构的入侵检测系统在准确率、精确率、检测率、误报率评估指标方面具有良好的性能指标。通过与传统的K近邻算法和支持向量机基准分类器的仿真实验对比,本文方法在对频繁数据Normal、DOS、Probe的检测率、准确率等方面具有较明显的优势。