基于DPDK的流量重组及分布式存储技术研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:chinaoristand
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,随之而来的网络攻击技术不断地对网络安全形势造成威胁。传统的网络流量监控方式对于当前不断提升的网络带宽来说难以得到满足。本文提出了基于DPDK框架的流量实时重组及存储技术方案,弥补了对于传统流量重组技术在实时性方面的不足;同时本文使用小文件合并以及对文件进行预读的方法优化了流量文件存储时的读写性能。其中所提出的流量实时重组方案以及对pcap文件的存储方案能够为后续的流量审计工作打下良好基础。本文对流量采集和重组技术以及流量数据存储等相关技术进行了研究。针对流量数据重组的性能效率问题,提出了基于DPDK框架的流量实时重组方案。该方案通过采用各个处理器核心内独立的流表以及超时检测队列的设计,使流量重组功能能在10Gbps网络得到了实时性的保障。针对DPDK框架使用的对称RSS算法无法满足多个处理器核心之间的负载均衡问题,本文提出了一套可用的负载均衡算法。通过采用多重hash的思想,使得采集到的网络流量能够被均衡分配至各个CPU处理核心中,提升了DPDK框架对于数据包进行多核处理时的性能;针对网络流量重组后可能产生过多小流量文件,从而影响HDFS读写效率的问题,本文提出使用FMM对小文件进行合并的方案。该方案通过在HDFS的Name Node与客户端之间加入文件元数据管理层对文件索引进行统一管理以及对小文件进行合并处理,能够在对小文件进行存储操作时减少与Name Node交互的次数;同时针对文件审计工作时对流量文件读取通常按照时间顺序的特点,设计了文件预读方案,提高了对小文件的读取性能。本文在上述技术方案的基础上进行了原型系统的设计与实现。该原型系统能够实现对流量数据的采集,并实现了网络流的高效重组功能。此外,在流量数据重组完成后本文还基于分布式文件系统实现了流量数据的持久化功能。本文还在该原型系统的基础上进行了实验与测试,实验结果表明该原型系统能够实现在10Gbps的网络环境下对流量数据进行采集以及实时流量数据重组,并能够将流量数据持久化至磁盘中。在10Gbps的网络环境下流量重组的高效性及实时性都有较好提升。相对于原本的DPDK方案,流量重组的处理效率提升了12.7%。而对于本文提出的小文件合并方案以及预读缓存方案,经实验对比相对于原始的HDFS对于小文件的存储效率提升了13.9%,而对于小文件的读取效率提升了37.3%。
其他文献
随着在线社交网络平台的迅速发展,产生了大量的非结构化数据,例如:用户发布的文本内容、参与讨论的话题标签以及用户之间的相互关注和互动等。虽然定位设备的普及使得位置信息很容易获取,但此类敏感数据仅限于特定的社交平台,因此,如何通过用户产生的内容和行为特征来推断用户住址的地理位置成为了人们关注的重点。用户地理位置的确定已成为许多下游应用提供服务的关键,比如:基于位置的定向广告、当地事件/地点的推荐、遵循
随着网络技术的飞速发展,网络空间安全面临着日益严峻的考验。攻击检测作为网络安全领域的一项关键技术,从网络系统中的关键点收集和分析信息,以查看网络中是否存在攻击行为。而图作为计算机科学研究的核心领域,由于其自身结构能够携带大量信息,越来越多地被应用于攻击检测领域。因此,本文对图模型及其相关计算在攻击检测领域的应用进行了研究。首先,本文基于危害指标提出了网络安全对象属性图模型。针对现有网络安全领域图模
人工神经网络是人工智能科学蓬勃发展进程中一个热门的研究领域。脉冲神经网络是一种基于脉冲时序编码的新兴人工神经网络模型,这种以精确脉冲时间进行信息表达的方式比传统的频率编码更能准确解释生物大脑的信息处理机制,且易于硬件实现。但因为脉冲神经网络在信息编码、神经元模型、网络结构等方面都具有鲜明的自身特点,所以无法直接利用传统神经网络中的算法进行模型训练。现在,由于综合高效的学习算法的缺失,脉冲神经网络强
网络性能指标是表征网络运行状态的参数,通常包括时延、丢包率、可用带宽等。网络性能指标测量就是采用特定的测量方法获取网络性能指标,进而为网络行为监控、网络异常发现以及网络故障分析等网络管理提供必要的输入信息。传统网络由于缺乏灵活的控制能力以及基本的网络测量功能,存在测量任务实施复杂度高、测量粒度较粗且准确性低等问题。在可编程网络中,用户能够通过统一的开放接口和编程语言自定义数据分组的处理流程,这样灵
域名系统(Domain Name System,DNS)是互联网的一项基础服务,提供了域名到IP地址的转换。DNS系统设计之初是在可信的环境里运行,但如今互联网环境复杂,使得DNS协议的脆弱性显现出来。因此本文总结了DNS系统的安全问题,大致可以分为两类:一是DNS协议存在的安全漏洞;二是DNS系统结构极度中心化造成的权利滥用风险。针对上述问题,本文提出并仿真实现了一种带取证分析扩展的DNS安全扩
如今,网络已进入千万寻常百姓家,这给人们的生活增添了色彩和便利,另一方面伴着网络模型越来越庞大,多种形式组网如:传感器网、ADHoc网络、天基网络等新出网络的增添,使得拓扑规模变得越来越大、很难去精准获得;网络设备数量很大,组网方式多种多类,接收信息次数变得越来越多等,这些多种状况的凸显,这提升了网络管理者在维护网络正常运行状态的难度。在这种情况下,网络运行态势感知技术应时而生。本文是基于网络运行
云计算时代,云存储越来越成为一种企业基础设施。为了在保障用户数据安全性的同时满足用户的功能需求,一些适用于云计算的密码学协议被提出,比如可搜索加密和代理重加密。当这些密码协议正常工作时,数据安全可以得到保证,但在实践中,运行密码协议的机器本身也可能成为攻击的对象。如果运行密码协议的机器本身被攻击,密码算法被替换,则密码协议将无法保证其安全性。斯诺登事件表明,情报机构可以通过行政权力替换密码算法。因
网络安全的形势日益严峻,安全防御技术意义重大。当前防火墙技术、入侵检测技术及防病毒技术等防御技术通常是针对攻击已经发生之后的反应,属于被动防御,具有防御滞后、难以防御未知攻击等局限性。因此,主动防御技术应运而生,其典型代表就是蜜罐以及由多个蜜罐组成的蜜网。然而,传统蜜网通常缺乏内部交流、过度依赖数据中心,在大规模网络防御中存在较大的局限性。目前,针对该缺点,已经有学者研究并提出去中心化的分布式蜜网
随着网络空间的发展,越来越多的Web服务在网络中出现。Web服务在给人们生活带来便利的同时,也带来许多安全隐患。如今越来越多的Web服务遭受到黑客的针对性攻击,许多网站运营商和用户遭受了很大损失。为了维护网络空间安全,所以对网络空间中的Web服务进行安全性检测迫在眉睫。目前,传统的Web服务安全性检测存在如下缺陷:一、Web服务的识别依赖于大量人工的辅助,收集构造完备的指纹库,才能实现Web服务的
网络带来的便利使得人们的生活高度依赖各种网络应用,一旦网络异常会给人们带来诸多影响。因此实时掌控网络运行状态,建立网络运行态势感知系统尤为重要。网络运行态势感知是将与网络运行相关特征数据进行收集、评估以及预测的过程,据结果做出如调整网络资源配置等决策来保证网络正常高效地运行。网络数据集具有无先验性、海量性等特征,网络状态评估具有模糊性的特点且态势预测需要具备实时性。模糊C均值(FCM)算法能够发掘