面向网络安全监控的流数据处理技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:bbxxxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,互联网在人们生活中扮演着越来越重要的角色。而随之而来的各种网络安全事件严重成胁着互联网的应用和发展。因此,以安全为目的的网络监控在维护网络正常高效运行、保障关键设施和确保信息系统安全等方面起着越来越重要的作用。如何对实时、海量的网络安全监控数据实施高效的在线分析,进而为各种应用提供进一步支持,成为网络安全和数据分析处理领域的一个研究重点。本文以网络安全监控为背景,针对网络安全监控的应用特点和实时监控数据分析处理存在的挑战性问题,从动态实时的数据流处理角度,研究了四类网络安全监控流数据的高效查询技术,分别为连续top.k监测、表连接优化、多查询优化、大时间窗口查询。本文的主要贡献为:1、改进了网络安全监控流中重要事件监测所使用的数据流连续top.k查询方法。建立有效的索引结构可以提高查询效率,而已有的数据流top.k索引一般基于网格索引,这些索引结构中存在大量自由数据点f可证明非top.k结果1。针对这一问题,本文提出了基于逆支配点集(reverse dominant point set,RI)PS)的top.k索引方法A.MC’R索引,该索引中通过逆支配点集性质_亨9枝了大量自由数据点,同时给出数据流中数据点加入和删除时肛MC!R的更新算法。理论分析和真实数据集上的实验证明肛McR索引在存储容量、查询效率等方面存在着优势。2、针对网络安全监控数据流分析中重要的表连接操作,研究了监控流与超大维表的表连接优化方法。IP地址维的数据量达到2”条记录,表连接过程中此类超大维表无法将整个表常驻内存,需划分为多个子块分块循环读入内存,造成磁盘I/频繁。基于这一问题,本文提出将超大维表按列分解压缩并常驻内存的多动态索引嵌套循环连接算法fMDI.NL.Join)。超大维表按其m个属性列划分为m个子维表并压缩,同时建立子维表索引;表连接时按查询语句中的投影所确定的属性列来动态调度对应的子维表索引,以确保使用冗余最小的子维表并利用索引提高连接探测效率。理论分析和实验表明该连接算法特别适合于维表连接键存在较大冗余的超大维表f如IP维表、银行账户维表等1。由于维表压缩为较小子表且压缩是无损的,表连接时每个嵌套循环过程探测扫描维表开销减少,提高了表连接效率并降低了存储维表的内存开销。3、对网络安全监控数据流的多个并发查询进行优化。数据流多查询优化可使用优化多查询计划和物化共享中间结果两种方法。现有的物化共享中间结果研究中使用物化视图或索引方式,且未对结果压缩存储。针对这一问题,本文提出了采用流数据方形式存储物化共享中间结果的方法,以及流数据方的压缩存储结构——压缩流数据方fcompressed Stream(:ube)。该方法以经典数据方树形压缩存储结构Qc.tree和Dw”f为基础,为进一步减少单位时间流数据方切片占用的内存空间,根据多查询需求将压缩存储结构中的完全物化所有中间结果改为部分物化;并建立结点物化收益模型,采用动态选择的方法按每个查询频率选择非物化结点。压缩流数据方以经典的压缩存储结构为基础,动态选择方法_亨9枝了大量非查询需求的物化结点,该方法虽然不可避免的_亨9枝了部分查询需求的物化结点,使查询性能降低,但在有限内存空间中较好的压缩了流数据方。以streamC)c_rree为例,通过理论分析和实验,在网络安全数据流中单位时间处理少量查询情况下可_亨9枝大量结点,以少量的降低查询响应速度为代价,有效地压缩了流数据方存储空间。4、针对网络安全监控流的大时间窗口查询问题进行了研究。由于计算和存储资源限制,数据流系统的查询时间窗口w限定在当前一段时间范围内,超出窗口w的大时间窗口查询无法计算。针对这一问题,本文通过综合数据流系统的实时计算及传统数据库系统的海量存储优势提出了增量式混合存储体系结构。数据流系统计算时采用“分治法”将时间窗口等分为多个不重叠的小时间块,只计算小时间块而获得整个时间窗口的结果,从而提高数据流系统计算效率。在传统数据库中采用物化视图存储窗口w外查询结果,并增量式接收小时问块结果来更新物化视图,避免了传统数据库中低效更新计算,提高了传统数据库的物化视图更新效率。该系统计算范围限于可增量计算的聚集查询,可适用于联机在线分析领域。综上所述,本文基于网络安全监控流数据处理应用中亟待解决的数据分析处理与查询问题,就数据流连续top.七监测、表连接、多查询优化、大时间窗口查询等几个重要的基础问题的关键算法进行了突破性研究,对于促进大规模网络安全监控数据分析处理的理论研究和实用化具有一定的理论意义和应用价值。
其他文献
目的:探究高溶量血液滤过对重症急性胰腺炎(SAP)的治疗作用。方法:对12例重症急性胰腺炎患者进行常规治疗再采用高溶量血液滤过治疗。结果:CVVH治疗8 h后,患者体温、呼吸次数、心
数据处理及存储过程中采用了分布式架构,其中有HDFS和Map Reduce两项关键技术。近两年,通信流量业务开展得如火如荼,用户上网行为的数据分析需求随之猛增,而处理这类数据需要
目的分析总结产褥期妇女睡眠的情况及其影响睡眠的因素,寻找护理方法,提高睡眠质量。方法采用自行设计的调查问卷,对住院产褥期妇女360例进行调查,睡眠形态紊乱表现在睡眠维
随着经济全球化进程的深入和Internet技术的广泛应用,企业对于跨越自身边界的业务流程管理和企业间业务协作的要求越来越迫切。按照一定的业务流程将企业应用系统集成起来一
目前在美国上市的550余家中国公司中,互联网企业占有举足轻重的地位。对于这次"清网"行动,中国企业需要做好顺势调整的准备,并提前做好预案。2020年8月6日,美国白宫网站发布
目的观察序贯三法治疗神经根型颈椎病的疗效。方法对490例患者进行了小针刀、真空火罐及手法整复的序贯治疗,具体方法为:①小针刀松解局部性粘连并减压。②用真空火罐自针刀孔
究竟何时才能迎来新的行业机遇期?业内专家认为,光通信企业还需静待时机出现。近日,备受业界关注的中国移动2020—2021年普通光缆产品集采中标结果公布,此次中标候选人为长飞
在2010年8月24日召开的“中澳政府管理项目总结大会暨项目成果国际交流会”上,发改委财政金融司司长徐林称,中国环境保护的压力非常大,如果排污企业,包括排污个人不缴纳环境税,对
"互联网+"智慧环保将互联网创新成果与生态环境保护进行深度融合,在推动生态环境领域技术进步的同时,对全面提高生态环境保护综合决策、监管和公共服务水平,加快环境管理方式和工作方式转变具有重要意义。本文从"互联网+"智慧环保的发展需求出发,梳理了生态环境信息采集、传输、管理和决策方面的技术现状并凝练发展面临的问题,针对性提出了"互联网+"智慧环保总体架构,具体阐述了精准治气、系统治水、生态监管、资源交
《黄帝内经》是中医药学理论体系的基础,也是学习中医的必读之书。学习《内经》可分为六个步骤:通读原文,掌握关键词;加强记忆,经典背诵;借助注家,明辨医理;结合医案,深刻体会