频繁模式挖掘在网络监测中的应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:real_dolia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的普及和发展,人们的工作与生活越来越依赖于安全可靠的网络环境,为了能够实时掌握网络动态、保证网络正常高速的运转,网络管理员进行网络监测就非常必要。然而网络流数据流量大、连续快速、不可预测的特点加剧了网络监测工作的困难。当前采用的方法或者是应用训练、学习、建模等的专门入侵检测技术,或者是抽样、散列、计数这样的近似性方法,前者的问题是需要先验知识且操作步骤复杂难于满足实时监测要求,后者的问题则是结果不精确且很难获取有意义的多模式结果。由于网络管理员更关心网络中频繁出现的网络负载和突发异常事件,因此本文考虑将数据挖掘中的频繁模式挖掘技术应用到网络监测这个新的应用环境中。为了保证挖掘结果的及时与准确性,首先,本文分析与设计专门适用于网络监测的滑动窗口处理模型,该模型无论从技术上还是实际需求上都符合网络流挖掘的要求;接着,考虑到网络流数据自身的分布与流动性特点,先后提出基于滑动窗口重挖算法、多模式重挖算法、多模式快速生成算法和多模式快速生成补充算法四种挖掘技术,逐个解决在将频繁模式挖掘应用到网络数据流时可能遇到的一系列问题;最后,本文以北京大学校园网为平台,开发基于频繁模式挖掘的校园网监测系统原型,对系统进行了全面的测试,并对提出的四种算法进行深入地评测与对比;挖掘结果经过存储与分析后,发现确实能够获得大量有价值的信息,大大加强了对校园网的监测能力,实现对校园网更加细致和有效的监控。因此本文的研究成果不仅为频繁模式挖掘提供了一个新的应用背景,也为网络监测提供了一种全新的监测技术,具有重要的研究意义与应用价值。
其他文献
稀疏数据是指包含大量空值的数据,具有维度高、稀疏、模式易变等特点。稀疏数据在实际应用中的大量出现给现代的RDBMS带来了巨大的挑战。在各类海量数据管理系统中,如何设计稀
强化学习是与传统的监督学习完全不同的学习框架。在强化学习中,agent感知环境的状态并采取相应的动作,同时得到环境的奖赏反馈。agent无需假设任何有关环境的先验知识,而是通过
软件体系结构作为高层的设计蓝图,在软件系统开发的过程中,其主要角色包括:支持开发人员之间的交流、直接支持系统开发、支持软件复用等。目前存在的问题是软件体系结构设计不断
如今,软件在人们的社会生活中占据越来越重要的地位,软件的正确性也受到人们越来越多的重视。特别是随着敏捷开发、开源软件等快速迭代开发模式的出现,人们对软件的安全可信提出
随着现代软件工程和开发技术的发展,SOA技术以其灵活高效的优势赢得了普遍的支持,并已经在分布式计算方面形成了一场革命。而另一方面人们逐渐进入了Web2.0时代,AJAX技术成为Web
为了实现磁共振快速成像,一种可行的方法是减少K空间数据的采集量。然而,基于欠采样K空间数据进行磁共振图像重建的问题是一个病态的反问题。由于压缩感知理论的出现,基于稀疏性
在本体构建和应用过程中,知识表示的正确性、表达性,以及是否可被共享和复用,将直接影响到对本体的正确应用。本体评价作为把握上述问题的必要手段之一,目前已经得到越来越多的研
随着数据挖掘技术的日益发展,数据隐私和信息安全逐渐引起人们的关注。如何保护私有信息或敏感信息在挖掘过程中不被泄露,已经成为数据挖掘研究中的一个很有意义的研究课题。
大数据时代,分布式文件系统存储服务面临巨大的压力与挑战,元数据管理技术是新型分布式文件系统实现可扩展性的关键因素,近年来受到了工业界和学术界的普遍关注。相比于数据,元数
近年来,计算机软件规模迅速扩张,软件功能日渐复杂,给开发健壮的软件系统带来困难。尤其在大型软件开发中,容易引入程序缺陷与错误。自动或半自动的程序缺陷探查工具,为开发者提供