【摘 要】
:
近年来,随着网络规模的日益扩大,入侵检测设备必须对海量的网络流量进行分析,然而,这些网络数据集具备维数高、冗余大等特点。现有的特征选择和聚类等方法在简化计算量方面取
论文部分内容阅读
近年来,随着网络规模的日益扩大,入侵检测设备必须对海量的网络流量进行分析,然而,这些网络数据集具备维数高、冗余大等特点。现有的特征选择和聚类等方法在简化计算量方面取得了一定的效果,但未能很好地解决收敛速度慢、检测精度低等问题。特征降维和样本约简是当前常用的数据预处理方法,研究一种有效的数据预处理算法以便达到实时、高效的入侵检测目的具有十分重要的意义和广泛的应用前景。本文首先介绍基于机器学习的网络入侵检测国内外研究现状,然后详细地阐述入侵检测的基本框架及数据预处理过程的特征降维和样本约简方法,最后结合特征降维过程中采用的IG-PCA算法以及样本约简过程中采用的CS算法,提出了一种基于IG-PCA和压缩感知的反馈入侵检测模型。本文的主要工作如下:(1)基于传统的特征选择和特征提取的方法,本文提出了一种基于Information Gain和PCA的特征降维方法。该方法首先通过Information Gain算法对样本的特征按重要程度进行排序,然后利用PCA算法确定需要保留的特征维数,从而选择最优的特征子集。(2)将图像处理领域的压缩感知算法引入到入侵检测中,通过对原数据集的重复样本进行压缩采样,构建的小样本集能够大大简化计算,缩短检测时间。并通过计算样本约简前后分类正确率的误差来确定该过程是否是一次有效的压缩,本文实验表明该样本约简方法对入侵检测应用是有效的。(3)根据前面提出的特征降维和样本约简方法,提出一种基于IG-PCA和压缩感知的反馈入侵检测模型。通过观察最后检测结果的准确率,选择不同观测矩阵的行数来控制压缩采样次数,实验得出最佳采样次数,从而达到实时、高精准检测的目的。本文提出的方法在确保较高的分类正确率的前提下能大大缩短检测时间,可广泛地应用于各种入侵检测系统。
其他文献
人工林的间伐不仅涉及林木生长与收获,而且关系到人工林的地力维持。如何维护人工林的地力、开展森林可持续经营已成为当今众多学者所关注的问题。本文以杉木(Cunninghamia l
采暖季节的集中供热系统中,存在着热容量不足的问题。在供、回水温度对于系统的热传递和节能有着十分重大影响的前提下,针对供热能耗现状和喷射式热泵的研究背景,本文提出了
Web应用已经渗透到了人们的日常生活中,用户与Web应用程序的交互一般是通过Web服务器来实现的。Web日志作为Web服务器最重要的一个部分,记录了 Web服务器的运行状况以及客户
名词动用是先秦汉语乃至现代汉语中一种常见的复杂的语言现象,以往对该现象的研究主要停留在描写层面,较少涉及更深层次的解释。《左传》是先秦时期一部重要的历史文献,具有很高的语料价值。从认知角度出发,运用原型范畴、概念转喻和概念隐喻等相关理论分析《左传》中名词动用现象,对了解上古汉语中名词动用的语义基础和认知机制具有重要意义。名词动用现象,属于原型范畴,范畴内的成员有典型和非典型之分。词类活用和词的兼类
淀粉作为一种天然可再生高分子资源,具有来源广、价格低、可降解等优点,这使其成为三大浆料之首,并在天然纤维素纤维及其与化纤混纺经纱的上浆中大量使用。但淀粉材料分子结
增强型长期演进(Long Term Evolution Advanced,LTE-A)是基于LTE的技术演进,是3GPP(The Third Generation Partnership Project)提出的一种新型的标准。LTE和LTE-A的同频组网
剩余污泥随着污水厂的建成而大量产生,严重危害人类健康和生态环境,将剩余污泥用于制备活性炭可解决这一难题。本论文以污水处理厂的剩余污泥为原料,选用ZnCl2、KOH和H3P04三
随着云计算技术的普及,用户可以通过互连网络获取自己所需的资源,系统以云服务的形式满足用户的请求。然而,对于同一个用户请求,往往有多个具有相同功能而服务质量(QoS)不同
进入信息化时代后,许多企业和组织机构纷纷部署自己的信息系统。主要的方法是独立购买相应的计算机硬件设备和软件系统,然后组织专门部门和技术人员负责部署、管理和维护。这
铜(Cu)是植物生长发育所必需的营养元素之一,当其过量时会对植物造成严重的伤害,同时也是对环境造成严重污染的元素之一。由于铜的氧化还原特性,能够通过Fenton反应产生如O2