论文部分内容阅读
随着互联网技术的普及和发展,人们的工作与生活越来越依赖于安全可靠的网络环境,为了能够实时掌握网络动态、保证网络正常高速的运转,网络管理员进行网络监测就非常必要。然而网络流数据流量大、连续快速、不可预测的特点加剧了网络监测工作的困难。当前采用的方法或者是应用训练、学习、建模等的专门入侵检测技术,或者是抽样、散列、计数这样的近似性方法,前者的问题是需要先验知识且操作步骤复杂难于满足实时监测要求,后者的问题则是结果不精确且很难获取有意义的多模式结果。由于网络管理员更关心网络中频繁出现的网络负载和突发异常事件,因此本文考虑将数据挖掘中的频繁模式挖掘技术应用到网络监测这个新的应用环境中。为了保证挖掘结果的及时与准确性,首先,本文分析与设计专门适用于网络监测的滑动窗口处理模型,该模型无论从技术上还是实际需求上都符合网络流挖掘的要求;接着,考虑到网络流数据自身的分布与流动性特点,先后提出基于滑动窗口重挖算法、多模式重挖算法、多模式快速生成算法和多模式快速生成补充算法四种挖掘技术,逐个解决在将频繁模式挖掘应用到网络数据流时可能遇到的一系列问题;最后,本文以北京大学校园网为平台,开发基于频繁模式挖掘的校园网监测系统原型,对系统进行了全面的测试,并对提出的四种算法进行深入地评测与对比;挖掘结果经过存储与分析后,发现确实能够获得大量有价值的信息,大大加强了对校园网的监测能力,实现对校园网更加细致和有效的监控。因此本文的研究成果不仅为频繁模式挖掘提供了一个新的应用背景,也为网络监测提供了一种全新的监测技术,具有重要的研究意义与应用价值。