Fp树算法的研究以及在入侵检测中的应用

来源 :江苏大学 | 被引量 : 0次 | 上传用户:LITAO14073164
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则是数据挖掘的一个重要研究方向,旨在挖掘项集之间的内在联系。Fp树算法是关联规则的一种基于深度的典型算法,具有良好的性能和可扩展性。Fp树通过自顶向下构造频繁树和自底向上挖掘频繁项集,只需扫描事务数据库两次便可以有效的挖掘出频繁项集,因而比基于宽度的Apriori算法快一个数量级。但是,Fp树采用递归的方法,同一条路径需要多次遍历,这成为制约Fp树算法效率的瓶颈。改进后的算法采用空间换时间的方法在每个节点上添加一个标记位来标识该节点是否被遍历,首先通过遍历Fp树找到所有叶子节点,然后从头表找出树中的叶子节点,从叶子节点开始回溯树中的路径,将同一条路径存储在一个线性链表中,从而减少同一条路径的遍历次数。实验显示:改进后的算法对于稀疏事务数据和稠密事务数据都能有效的提高挖掘效率,虽然增加了标记位的空间消耗,但是同时减少了条件Fp树的生成,因而空间性能也有所提高。 入侵检测是数据挖掘的一个重要应用方向,而挖掘算法效率的提高则是其中的一个研究热点。本文分析了当前入侵检测的研究进展,采用Jpcap开源库设计了入侵检测的数据采集模块。将改进后的Fp算法应用于入侵检测中的关联规则挖掘中,采用主轴因子和参考因子有效地过滤频繁项集来获得规则集,通过模式比较来获得入侵行为。采用林肯实验室的1998年的网络实时数据进行实验,将改进后的Fp树算法应用到关联规则的模式库挖掘中,采用不同的支持度来挖掘训练数据集和测试数据集。实验结果显示,对于入侵数据,改进后的Fp树算法比原Fp树算法挖掘效率更高。检测结果显示,改进后的算法具有良好的检测率和较低的误检率。
其他文献
软件是否严格按照设计要求实现,是软件质量评估的重要标准,是软件测试的一项重要工作。人工遍历的方法分析软件设计与实现的一致性是复杂费力的,并且需要测试人员具备丰富的编程
Web服务是架构在XML和Internet技术之上的分布式计算技术。如何正确、高效得从庞大的Web服务群中找到自己所需的服务越来越具有挑战性。主流的Web服务发现采用基于UDDI、WSDL
目前排版格式主要依靠人工检查,准确率和效率都较低,现有的一些自动排版格式检查算法适用范围有限,文档格式向量没有合理量化,检查准确率较低,难以重构文档的整体逻辑结构。为了解
需求是推动人们不断进行研究的动力,传统的固定结构计算技术渐渐不能满足市场需求的快速变化。可重构计算技术作为一种新兴的技术,兼容了硬件的处理速度和软件的灵活性。它以
随着互联网技术的广泛应用,电子商务得到了迅速的发展。电子商务的发展先后经历了EDI技术和RN模式两个阶段。第二阶段的RN标准比起EDI是很大一个进步。它依托一些大客户品牌
随着工业技术的发展,旋转机械运行的监测保护已经成为保障安全生产和企业经济效益的关键措施。目前市场上的旋转机械监测保护系统,国外产品配备的软件多为英文界面,操作方法
随着计算机技术和网络应用的普及,人们对计算机系统的依赖日益增强。一些关键性的业务处理系统要求计算机服务系统具有很高的可用性,以保证业务处理的连续。因此必须提高业务系
在过去的十几年中,通讯网络经历了巨大的变革。包交换技术最终使传统的语音网络和数字网络融合到一起成为统一的多媒体网络,其范围进一步扩展,将有线,无线,蜂窝网络融合一体。有线
随着计算机应用领域的不断拓展,教育领域首当其冲,尤其对于聋儿教育领域,借助先进的计算机多媒体工具进行教学,实现传统媒体与电教媒体的有机结合,可以更好地利用聋幼儿的残余听力
组态软件是针对数据采集与过程控制的专用软件,它是使用在自动控制系统监控层一级的软件平台和开发环境,它能以灵活多样的组态方式(而不是编程方式)提供良好的用户开发界面和