基于粗糙集和偏最小二乘法的网络入侵检测模型研究

来源 :数字化用户 | 被引量 : 0次 | 上传用户:yoyo220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】针对入侵检测知识库冗余性高、现有最小二乘网络入侵检测识别率低的难题,本文提出了基于粗糙集和偏最小二乘法的入侵检测模型,首先应用粗糙集算法对入侵检测知识库进行约简去冗,提取入侵检测规则,其次利用偏最小二乘法对检测对检测规则进行回归分析,经实验验证分析表明,本文提出的入侵检测模型具有良好识别率,对噪声也有一定的鲁棒性。
  【关键词】粗糙集 入侵检测 小二乘
  随着通信技术及计算机技术的快速发展,计算机网络成为了人们工作、生活不可缺少的基础设施,网络安全问题也越来越收到人们的重视。其中入侵检测是网络安全领域研究的一个热点,各国学者也对入侵检测做了很多的研究,研究主要是如何改善网络入侵检测的性能以及减少误报率、漏报率。文献[1]提出了基于基于Fisher分和支持向量机入侵检测模型,其很好的解决了单子支持向量机学习效率低下,检测误报率高的难题。文献[2]提出了一种基于改进的RBF神经网络的入侵检测方法,与BP神经网络检测模型相比具有更好的识别率,然而这些检测模型都面临一个重要的难题就是网络入侵检测规则库冗余性较高的难题,本文提出了一种基于粗糙集和偏最小二乘的网络入侵检测模型,利用粗糙集算法对网络入侵检测知识库金融约简去冗,然后利用偏最小二乘法对诊断规则进行回归分析。
  一、于粗糙集理论的入侵检测规则提取
  (一)集基本理论
  粗糙集(Rough set)理论有波兰数学家在1992年提出,其是一种处理不完整、不相容知识、不确定数据的一种理论方法,其主要是对不完整数据进行归纳、学习、推理、重新表达。其有别于其他的数据处理方法,粗糙集不需要关于原始数据的先验信息,如隶属度、概率分布等先验信息。直接针对数据本身进行数据处理。在不改变数据分类的情况下对决策表进行约简处理,删除冗余属性,求的数据的最小表达,建立决策规则。本文利用粗糙集算法对入侵检测知识库进行约简去冗,提取检测模型。
  网络入侵检测知识库中存在着大量的冗余信息,网络入侵特征属性并不是同等重要的,传统的方法不能很好的解决网络入侵检测知识库冗余性较高的难点。本文将粗糙集引入到网络入侵检测之中,利用粗糙集理论删除知识库中的不相关或者不重要的特征属性。利用粗糙集理论对数据处理客观性的优点,提出了将粗糙集理论引入到网络入侵领域,对网络故障诊断知识库约简去冗。
  (二)属性重要度的入侵检测规则提取算法
  属性重要度算法是一种启发式算法,其避免了宽度优先策略计算复杂、计算量大的缺点。具有约简速度快,效率高的特点。算法首先计算出决策表的核,然后计算每个特征状态属性相对于决策属性的重要度,依次选取属性重要度高的属性加入到核中,判断是否是决策表的最小约简结果。本文利用属性重要度算法对入侵检测知识库进行规则提取。
  二、基于粗糙集和偏最小二乘的入侵检测模型
  (一)二乘法基本理论
  在实际问题中,经常需要研究两组多重变量间的相互依赖关系,并研究一组变量去预测另一组变量,常用的方法有最小二乘法、主成成分分析法、偏最小二乘法。偏最小二乘回归提供一种多对多线性回归建模的方法,特别当两组变量的个数很建立的模型具有传统的经典回归分析等方法所没有的优点。 因此本文将偏最小二乘运用到网络入侵检测之中,在入侵检测状态数据与网络入侵类型之间建立回归模型。
  (二)小二乘入侵检测模型
  考虑个网络入侵类型与自变量的建模问题。偏最小二乘回归的基本做法是首先在自变量集中提出第一成分(是的线性组合);同时在因变量集中也提取第一成分,并要求与相关程度达到最大。然后建立因变量与的回归,如果回归达到满意的精度,则算法中止。否则继续第二对成分的提取,直到达到满意的精度为止。若最终对自变量集提取个成分,偏最小二乘回归将通过建立与之间的回归,然后再表示为与自变量的回归方程式。
  三、实验分析
  四、总结
  本问首先对网络入侵类型进行数值编码。其次利用粗糙集算法对离散化的决策表进行约简,提取诊断规则。最后对本文提出的基于粗糙集的模型进行了测试分析,结果表明用在高噪声环境下,本文提出的模型仍然具有较高的识别率,表明了本文提出模型的有效性。
  参考文献:
  [1]张雪芹,顾春华.一种网络入侵检测特征提取方法[J].华南理工大报,2010.38(1):81-84
  [2]一个基于改进遗传算法的RBF网络入侵检测模型[J].合肥工业大报,2010.33(3):368-371
  [3]申爱华,陈燕. 一种基于粗集的数据约简改进算法[J]. 大连海事大学学报,2004.(2):108-110
  [4]王钰,王任,苗夺谦等.基于 RoughSet 理论的“数据浓缩”[J].计算机学报,1998,21(5):393-400
  [5]贺湘宇, 何清华, 谢习华 ,蒋苹 ,周旭.基于偏最小二乘回归的挖掘机液压系统故障诊断[J].中南大学学报,2007.6 ,38(6):1152 - 115.
其他文献
目的 观察阻抑核心岩藻糖基化修饰对前B细胞信号传导的调节作用.方法 利用逆转录病毒包装技术建立核心岩藻糖转移酶Fut8基因沉默前B细胞株(70Z/3-Fut8-RNAi细胞).用实时定量聚合酶链反应(Real-time PCR)及Western blot检测Fur8 mRNA、蛋白表达和细胞内信号分子的酪氨酸磷酸化水平.结果 成功构建重组pSINsi-hU6-Fut8 siRNA质粒,逆转录病毒包
【摘 要】本文对英语口语考试的现状进行分析,并将“人机对话” 与“人人对话”口语考试模式对比分析,并对“人机对话”系统研究的内容和目的进行了阐述,最终,总结出“人机对话”英语口语考试系统研究的意义。  【关键词】人机对话 人人对话 意义  一、英语口语考试的现状分析  现行高校所采用的口语考试形式主要是师生间“人人对话”这种面对面的考试形式。典型的这种“人人对话”式的口语考试有:雅思日语考试((I
目的探讨Brugada综合征(BrS)患者不同体温状态对心电图校正的QT间期(QTc)的影响,并对两者进行相关性分析,阐述其可能的机制及临床意义。方法选择2008年5月至2013年5月在南京医科大学第一附属医院明确诊断的BrS患者为实验组,以年龄、性别相匹配的阵发性室上性心动过速(PSVT)患者为对照组,对每例患者均每日多次测量体温并同时行心电图检查,采用Bazett公式计算QTc,将体温和QTc
【摘 要】随着教育现代化的发展,多媒体教学已被广泛运用在教学过程中,且越来越受到广大教育工作者的重视,最近听了较多的数学公开课和常态课,很高兴地看到经过十多年的探索与实践,绝大多数教师能理性地运用“多媒体”这一先进的技术,为我所用。万事,有利就有弊,多媒体教学有时也会起到反作用,处理不好反而会影响学生的成长。有一小部分教师存在着“流于形式,用课件代替板书”以及“过于重视技术形式的外在表现,导致画蛇
目的 探讨MRI多序列联合应用在自身免疫性胰腺炎(AIP)诊断和鉴别诊断中的价值.方法 回顾性分析12例AIP患者的MRI资料,包括T1加权成像、T2加权成像、磁共振胰胆管成像(MRCP)、弥散加权成像(DWI)和动态增强扫描.观察病变累及部位、范围、信号及动态强化方式,胰胆管的改变、假包膜征及其他伴随征象.将正常胰腺及胰腺癌患者各12例作为对照.AIP组与胰腺癌组影像学征象比较采用Fisher确
<正>为庆祝Arup Associates成立50周年,充分展现其一体化设计和可持续性的先锋建筑理念,2014年3月25日,在上海南岸艺术中心(上海南苏州路1247号)举办为期两周的Arup Associat
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
【摘 要】随着新课程改革的不断深入,以多媒体技术和数字化实验室等新媒体技术为主的物理教学越来越被广大的师生认识和接受。尤其是数字化实验作为初中物理教学的一部分,对于高效率推进物理教学现代化进程,提高教学效果,培养学生的观察能力、操作能力、分析能力等方面都有其优势和潜力。数字化、信息化已成为时代的潮流,人们的日常生活、学习、工作等已很难离开数字化技术,数字化环境已经成为同学们生活和学习的主要空间,把
目的 观察脂肪来源的间充质干细胞(ad-MSCs)在经过传代扩增后诱导内皮细胞方向的分化能力.方法 使用胶原酶消化法分离培养原代脂肪间充质干细胞,检测其生长特性并用流式细胞术对其进行了联合免疫表型鉴定,诱导其多向分化来确定其干细胞特性.扩增后的高代次(P5)脂肪间充质干细胞被用于进行3种条件下的诱导内皮细胞方向分化(基础培养基+血管内皮生长因子(VEGF)、内皮细胞支持液+VEGF、仅用内皮细胞支