论文部分内容阅读
随着科技水平的高速发展,互联网给人们带来诸多便利的同时也给网络空间安全带来了巨大的威胁,如网络病毒、黑客等入侵的出现,可能会导致人民或政府财产的损失,甚至还会引起严重的社会恐慌。入侵检测系统作为计算机中的安全防线,可以动态的监测网络中的异常流量。因此对入侵检测展开研究具有重要的经济价值和社会价值。目前,深度学习已经成为入侵检测的常用技术,并且在准确率方面已经取得了良好的研究成果。但是仍然存在一些不足之处:现有的深度学习入侵检测模型整体检测率较高,但是对于数据集中小类入侵样本的检测率较低,容易产生过拟合现象,存在较高的误报和漏报率。并且深度学习入侵检测模型存在参数较多,训练时间长的问题。本文针对以上不足分别在数据层面和算法层面展开研究,主要的研究内容和贡献如下:(1)针对小类入侵样本检测率低,深度神经网络训练速度慢的问题。本文在数据层面提出了基于改进过采样及深度学习模型的入侵检测算法。首先提出了改进的过采样KSMOTE算法,由于在传统的采样过程中没有考虑到样本分布边缘离群点的处理问题,本文根据每个样本的近邻样本比例计算近邻平衡率并设立阈值,根据样本分布位置的不同,将样本划分为危险数据、边界数据和安全数据三类。对不同类型的样本采取不同的过采样操作。另外考虑到现有深度学习入侵检测模型存在参数较多,训练时间长的问题,本文提出将传统的卷积核分解为非对称的卷积核结构来缩减模型的参数,提出非对称的卷积自编码器(NCAE)对数据进行特征提取。最后构建了以偏二叉树为结构的集成孪生支持向量机分类器对特征进行检测。通过结合深层和浅层学习技术,保证了入侵检测的准确率,缩短了模型的训练时间,提高了小类入侵样本的准确率。(2)针对在不利于进行采样的数据集中存在小类入侵样本检测率低,漏报率和误报率高,模型训练过程中易出现过拟合现象的问题。本文在算法层面提出了基于CNN(Convolutional Neural Network)和LSTM(Long Short-Term Memory)的深度伪孪生网络入侵检测算法。提出在孪生神经网络的结构上,构造两个不同的分支网络结构:一个是CNN分支网络,它能够有效学习到数据中的特征信息,另一个是LSTM分支网络,它能够将不同维度的特征组合成序列进行输入,提高模型的泛化能力。通过实验验证,本模型能够提高数据集中的小类入侵样本的检测率,同时提高了算法的整体准确率,较好的实现了本文的研究目标,进一步提升了网络入侵检测技术。