基于半监督聚类的入侵检测算法研究

被引量 : 0次 | 上传用户:sherry77677
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络信息系统需要采取主动的防御措施。入侵检测技术是近20年来出现的一种主动保护系统、免受黑客攻击的新型网络安全技术。传统的入侵检测算法是基于监督学习的,检测率较高,误报率较低,但无法检测到未知攻击,且要求将数据正确地标记为正常或异常。网络环境中存在大量的未标记数据,要正确地标记这些数据,几乎是不可行的。如果将非监督学习方法应用到入侵检测中,基于聚类的入侵检测算法能够检测未知攻击,检测率较高,但误报率也较高。由此本文提出基于半监督学习的入侵检测算法。半监督学习是机器学习领域中一个新的研究热点,通过标记数据和未标记数据的联合概率分布,来改进分类器的性能。根据网络数据的特点,本文提出了基于半监督聚类的入侵检测算法,利用少量的标记数据,生成用于初始化算法的种子聚类,然后辅助聚类过程,检测已知和未知攻击。在网络环境中,标记数据是有限的,为了充分利用监督信息,用户需要主动查询标记数据的约束,而不是随机选择约束,这样即使少量的约束也能大大改进算法的性能。本文系统地研究入侵检测系统的基本理论,介绍了入侵检测的定义,分析了入侵检测的模型、研究现状和当前存在的问题。针对基于聚类的入侵检测算法误报率高的问题,提出了基于半监督聚类的入侵检测算法ACKID。论文将主动学习策略应用于半监督聚类过程中,主动学习策略查询网络中未标记数据与标记数据的约束关系,采用FarthestFirst对未标记数据进行标记。KDD Cup99数据集是用于评估入侵检测算法的标准数据集,结合KDD Cup99数据集,分析了ACKID入侵检测算法的评估过程,确定ROC曲线为ACKID算法的评估指标,分析网络数据的属性特征并对数据预处理,最后评估ACKID算法的性能。实验结果表明,ACKID算法能够检测出未知攻击,证实利用标记数据和约束可以提高算法的检测率,降低误报率,并且表明采用主动学习策略能够获取最有用的监督信息以检测未知攻击。
其他文献
目的实验探讨认知护理干预对高龄不孕症患者辅助生殖治疗的效果。方法选取300例接受辅助生殖治疗的高龄不孕症患者进行分析,将其随机均分并设组,分别实施认知护理干预和常规
随着经济的发展和社会的进步,企业竞争优势逐渐从传统的资源、资金方面的优势转向了技术、管理方面的优势,文化建设作为影响企业的竞争力的最根本的因素之一,开始越来越被社
针对暗挖海底隧道开挖面围岩稳定性问题,总结极限分析上限法、楔形体模型、二维对数螺旋线模型以及条分法模型4种理论解析模型,并考虑了海底隧道开挖面滑移体上部地层压力等
目的对45例桡神经损伤晚期手功能重建术后患者的康复锻炼进行系统规划,制定康复路径,促进手功能的恢复。方法 2009年1月至2012年1月无锡市第九人民医院对45例桡神经损伤严重
舰载机着舰是飞机整个飞行过程中的关键环节,受到舰船的运动和海上的大气紊流扰动,是事故多发环节。本文对舰载飞机的着舰环境建立了数学模型,提出了一种基于推力补偿系统与
20世纪90年代中期以前,我国农地流转率一直偏低,直至近几年,我国农村土地承包经营权流转有了一定的提高,但与其他发展中国家相比,我国农民超小规模的农业经营模式并没有得到
绩效考核是企业人力资源管理系统中最重要的组成部分之一,建立绩效考核体系是进行绩效管理的一个新的发展方向,是关系到整个管理系统的重要环节。如何设计一套科学的、符合我国
紫杉醇是一种从太平洋红豆杉树树皮中提取的有效抗肿瘤药。临床研究已经证实了紫杉醇在抗多种实体肿瘤,包括乳腺癌、晚期卵巢癌、肺癌、脑部和颈部肿瘤以及急性白血病方面,都有
 中小学全面实施素质教育,是我国社会主义事业发展的客观要求,势在必行。摆在教师面前的主要任务是进行教学改革,把素质教育贯穿在课堂教学过程中,让学生把知识变为能力,使学生的
方言语法研究是汉语语法研究的一个重要方面,尤其是像河南方言那样不为广大方言研究者所重视的方言点,其方言语法研究显得相对落后。河南话中的语气助词“哩”是一个非常具有