论文部分内容阅读
【摘 要】针对入侵检测知识库冗余性高、现有最小二乘网络入侵检测识别率低的难题,本文提出了基于粗糙集和偏最小二乘法的入侵检测模型,首先应用粗糙集算法对入侵检测知识库进行约简去冗,提取入侵检测规则,其次利用偏最小二乘法对检测对检测规则进行回归分析,经实验验证分析表明,本文提出的入侵检测模型具有良好识别率,对噪声也有一定的鲁棒性。
【关键词】粗糙集 入侵检测 小二乘
随着通信技术及计算机技术的快速发展,计算机网络成为了人们工作、生活不可缺少的基础设施,网络安全问题也越来越收到人们的重视。其中入侵检测是网络安全领域研究的一个热点,各国学者也对入侵检测做了很多的研究,研究主要是如何改善网络入侵检测的性能以及减少误报率、漏报率。文献[1]提出了基于基于Fisher分和支持向量机入侵检测模型,其很好的解决了单子支持向量机学习效率低下,检测误报率高的难题。文献[2]提出了一种基于改进的RBF神经网络的入侵检测方法,与BP神经网络检测模型相比具有更好的识别率,然而这些检测模型都面临一个重要的难题就是网络入侵检测规则库冗余性较高的难题,本文提出了一种基于粗糙集和偏最小二乘的网络入侵检测模型,利用粗糙集算法对网络入侵检测知识库金融约简去冗,然后利用偏最小二乘法对诊断规则进行回归分析。
一、于粗糙集理论的入侵检测规则提取
(一)集基本理论
粗糙集(Rough set)理论有波兰数学家在1992年提出,其是一种处理不完整、不相容知识、不确定数据的一种理论方法,其主要是对不完整数据进行归纳、学习、推理、重新表达。其有别于其他的数据处理方法,粗糙集不需要关于原始数据的先验信息,如隶属度、概率分布等先验信息。直接针对数据本身进行数据处理。在不改变数据分类的情况下对决策表进行约简处理,删除冗余属性,求的数据的最小表达,建立决策规则。本文利用粗糙集算法对入侵检测知识库进行约简去冗,提取检测模型。
网络入侵检测知识库中存在着大量的冗余信息,网络入侵特征属性并不是同等重要的,传统的方法不能很好的解决网络入侵检测知识库冗余性较高的难点。本文将粗糙集引入到网络入侵检测之中,利用粗糙集理论删除知识库中的不相关或者不重要的特征属性。利用粗糙集理论对数据处理客观性的优点,提出了将粗糙集理论引入到网络入侵领域,对网络故障诊断知识库约简去冗。
(二)属性重要度的入侵检测规则提取算法
属性重要度算法是一种启发式算法,其避免了宽度优先策略计算复杂、计算量大的缺点。具有约简速度快,效率高的特点。算法首先计算出决策表的核,然后计算每个特征状态属性相对于决策属性的重要度,依次选取属性重要度高的属性加入到核中,判断是否是决策表的最小约简结果。本文利用属性重要度算法对入侵检测知识库进行规则提取。
二、基于粗糙集和偏最小二乘的入侵检测模型
(一)二乘法基本理论
在实际问题中,经常需要研究两组多重变量间的相互依赖关系,并研究一组变量去预测另一组变量,常用的方法有最小二乘法、主成成分分析法、偏最小二乘法。偏最小二乘回归提供一种多对多线性回归建模的方法,特别当两组变量的个数很建立的模型具有传统的经典回归分析等方法所没有的优点。 因此本文将偏最小二乘运用到网络入侵检测之中,在入侵检测状态数据与网络入侵类型之间建立回归模型。
(二)小二乘入侵检测模型
考虑个网络入侵类型与自变量的建模问题。偏最小二乘回归的基本做法是首先在自变量集中提出第一成分(是的线性组合);同时在因变量集中也提取第一成分,并要求与相关程度达到最大。然后建立因变量与的回归,如果回归达到满意的精度,则算法中止。否则继续第二对成分的提取,直到达到满意的精度为止。若最终对自变量集提取个成分,偏最小二乘回归将通过建立与之间的回归,然后再表示为与自变量的回归方程式。
三、实验分析
四、总结
本问首先对网络入侵类型进行数值编码。其次利用粗糙集算法对离散化的决策表进行约简,提取诊断规则。最后对本文提出的基于粗糙集的模型进行了测试分析,结果表明用在高噪声环境下,本文提出的模型仍然具有较高的识别率,表明了本文提出模型的有效性。
参考文献:
[1]张雪芹,顾春华.一种网络入侵检测特征提取方法[J].华南理工大报,2010.38(1):81-84
[2]一个基于改进遗传算法的RBF网络入侵检测模型[J].合肥工业大报,2010.33(3):368-371
[3]申爱华,陈燕. 一种基于粗集的数据约简改进算法[J]. 大连海事大学学报,2004.(2):108-110
[4]王钰,王任,苗夺谦等.基于 RoughSet 理论的“数据浓缩”[J].计算机学报,1998,21(5):393-400
[5]贺湘宇, 何清华, 谢习华 ,蒋苹 ,周旭.基于偏最小二乘回归的挖掘机液压系统故障诊断[J].中南大学学报,2007.6 ,38(6):1152 - 115.
【关键词】粗糙集 入侵检测 小二乘
随着通信技术及计算机技术的快速发展,计算机网络成为了人们工作、生活不可缺少的基础设施,网络安全问题也越来越收到人们的重视。其中入侵检测是网络安全领域研究的一个热点,各国学者也对入侵检测做了很多的研究,研究主要是如何改善网络入侵检测的性能以及减少误报率、漏报率。文献[1]提出了基于基于Fisher分和支持向量机入侵检测模型,其很好的解决了单子支持向量机学习效率低下,检测误报率高的难题。文献[2]提出了一种基于改进的RBF神经网络的入侵检测方法,与BP神经网络检测模型相比具有更好的识别率,然而这些检测模型都面临一个重要的难题就是网络入侵检测规则库冗余性较高的难题,本文提出了一种基于粗糙集和偏最小二乘的网络入侵检测模型,利用粗糙集算法对网络入侵检测知识库金融约简去冗,然后利用偏最小二乘法对诊断规则进行回归分析。
一、于粗糙集理论的入侵检测规则提取
(一)集基本理论
粗糙集(Rough set)理论有波兰数学家在1992年提出,其是一种处理不完整、不相容知识、不确定数据的一种理论方法,其主要是对不完整数据进行归纳、学习、推理、重新表达。其有别于其他的数据处理方法,粗糙集不需要关于原始数据的先验信息,如隶属度、概率分布等先验信息。直接针对数据本身进行数据处理。在不改变数据分类的情况下对决策表进行约简处理,删除冗余属性,求的数据的最小表达,建立决策规则。本文利用粗糙集算法对入侵检测知识库进行约简去冗,提取检测模型。
网络入侵检测知识库中存在着大量的冗余信息,网络入侵特征属性并不是同等重要的,传统的方法不能很好的解决网络入侵检测知识库冗余性较高的难点。本文将粗糙集引入到网络入侵检测之中,利用粗糙集理论删除知识库中的不相关或者不重要的特征属性。利用粗糙集理论对数据处理客观性的优点,提出了将粗糙集理论引入到网络入侵领域,对网络故障诊断知识库约简去冗。
(二)属性重要度的入侵检测规则提取算法
属性重要度算法是一种启发式算法,其避免了宽度优先策略计算复杂、计算量大的缺点。具有约简速度快,效率高的特点。算法首先计算出决策表的核,然后计算每个特征状态属性相对于决策属性的重要度,依次选取属性重要度高的属性加入到核中,判断是否是决策表的最小约简结果。本文利用属性重要度算法对入侵检测知识库进行规则提取。
二、基于粗糙集和偏最小二乘的入侵检测模型
(一)二乘法基本理论
在实际问题中,经常需要研究两组多重变量间的相互依赖关系,并研究一组变量去预测另一组变量,常用的方法有最小二乘法、主成成分分析法、偏最小二乘法。偏最小二乘回归提供一种多对多线性回归建模的方法,特别当两组变量的个数很建立的模型具有传统的经典回归分析等方法所没有的优点。 因此本文将偏最小二乘运用到网络入侵检测之中,在入侵检测状态数据与网络入侵类型之间建立回归模型。
(二)小二乘入侵检测模型
考虑个网络入侵类型与自变量的建模问题。偏最小二乘回归的基本做法是首先在自变量集中提出第一成分(是的线性组合);同时在因变量集中也提取第一成分,并要求与相关程度达到最大。然后建立因变量与的回归,如果回归达到满意的精度,则算法中止。否则继续第二对成分的提取,直到达到满意的精度为止。若最终对自变量集提取个成分,偏最小二乘回归将通过建立与之间的回归,然后再表示为与自变量的回归方程式。
三、实验分析
四、总结
本问首先对网络入侵类型进行数值编码。其次利用粗糙集算法对离散化的决策表进行约简,提取诊断规则。最后对本文提出的基于粗糙集的模型进行了测试分析,结果表明用在高噪声环境下,本文提出的模型仍然具有较高的识别率,表明了本文提出模型的有效性。
参考文献:
[1]张雪芹,顾春华.一种网络入侵检测特征提取方法[J].华南理工大报,2010.38(1):81-84
[2]一个基于改进遗传算法的RBF网络入侵检测模型[J].合肥工业大报,2010.33(3):368-371
[3]申爱华,陈燕. 一种基于粗集的数据约简改进算法[J]. 大连海事大学学报,2004.(2):108-110
[4]王钰,王任,苗夺谦等.基于 RoughSet 理论的“数据浓缩”[J].计算机学报,1998,21(5):393-400
[5]贺湘宇, 何清华, 谢习华 ,蒋苹 ,周旭.基于偏最小二乘回归的挖掘机液压系统故障诊断[J].中南大学学报,2007.6 ,38(6):1152 - 115.