高速网络数据流应用检测系统的设计与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户:goubo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络流量测量是指对数据链路上的报文进行采集、分析、建模,结合具体算法分析网络行为的过程,是分析网络性能,理解互联网用户行为,检测网络异常、网络安全事件的重要前提。通过对流长、流数测度等流量特征进行分析,解决测量应用中大流检测、流长分布估计等关键问题,能够为网络的有效运行、管理和维护提供有力的支撑。但随着网络关键基础设施的不断完善,网络链路速率不断提高,在高速网络上进行流量测量需要更多的计算和内存资源,流量测量研究与分析工作面临巨大的技术挑战。为此,本文设计并实现高速网络数据流应用检测系统,通过抽样技术、数据流技术对海量流量进行缩减,完成高速链路下的流量测量任务。本论文的主要内容如下:1.基于遗传编程算法设计并实现适用于数据流技术的非加密哈希算法。哈希算法作为数据流技术的核心,需满足哈希值的随机性尽可能大,算法简单高效,对同一哈希输入能生成多个独立不相关的哈希值等要求。本文针对以上要求,分别以IPv4、IPv6流量为训练集,基于遗传编程设计并自动生成体现IP流量特征的哈希算法GP-Hash,与17种具有代表性的字符串哈希函数在多个测度上进行比较,验证GP-Hash在数据流技术中的可用性。2.提出基于GA-EM的原始流长分布估计算法。抽样技术是降低高速链路中海量流量数据带来的存储和分析压力的最广泛使用的方法之一,但同时抽样会带来原始流量信息损失问题。本文针对期望最大化算法推断原始流长分布时存在的初始值敏感、易陷入局部最优、计算复杂度较高等问题,提出基于遗传算法和期望最大化的GA-EM混合算法,利用遗传算法全局收敛、使用适应值函数指导搜索多峰复杂空间等优点,以更高的精度还原原始流量分布。3.设计并实现高速网络数据流应用检测系统。该系统包含大流检测模块、流长分布估计模块以及可视化模块。在大流检测模块中,基于GP-Hash哈希库,利用Count-Min Sketch对高速网络中的报文分组进行计数统计,检测识别链路中的大流。流长分布估计模块基于样本流信息,使用GA-EM算法对原始流信息进行推断,通过在不同数据源上进行对比实验,验证了对原始流量中活跃流总数以及原始流长分布的估计均能达到更高的精确度。
其他文献
<正>有一道经常出现的初中物理竞赛题:怎样测量篮球从某一高度自由落下时地面对篮球的最大弹力?原解:把1张白纸平放在地面,然后把篮球的表面洒上水,让篮球击到白纸上,留下水
现今商业银行的业务类型数量提升,同时民众对资金交易的便利性提出要求很高,所以要借助区块链技术完成对传统业务的革新。基于对区块链技术原理和作用形式的研究,本文提出了
伴随着信息时代的快速发展,现代息息社会经济发展水平不断拓展,企业与企业之间的竞争激烈水平越来越大。面对激烈的竞争市场,需要以稳定的供电行业发展为要求,运用企业财务自
本文结合民办高校师德建设存在的问题,提出社会主义核心价值观引领下师德建设对策和民办高校师德建设保障机制,为民办高校师德建设提供参考。
国家统计局最新数据显示,我国物流费用占GDP总额的16%,远高于全球平均费用。目前,我国运输行业存在大量空驶、迂回等现象,造成资源浪费,这都是信息不对称引起的。这表明,在供
BP网络是广为应用的一种前馈网络,但是由于其自身缺陷,其它网络越来越受到关注.目前RBF网络是前馈网络研究中的一个热点,有关其逼近理论以及算法的研究出现在许多文献之中.本
迅速精确地检测离子膜的单元槽电压是发现离子膜破漏、缩短开车时间的关键。然而原有的检测方案并不能完全满足单元槽电压检测的及时性和准确性要求。通过开发专用槽电压检测
《撒母耳记·上》对大卫在以色列王权崛起的描述,与《埃努玛·埃利什》对马尔杜克宇宙神权崛起的描绘,存在着某些具有重要意义的观念、主题和文学表现上的一致性。同时《圣经
在哲学和哲学史研究中,有一个流行甚广、影响甚大的观念,那就是认为整个哲学经历了一个从古代“本体论”哲学———近代“认识论”转向———现代“语言学转向”的演变过程。
本文讨论了马克思东方社会道路理论研究中论争的几个主要问题,论证了以下几点:1.马克思的跨越“卡夫丁峡谷”理论对于时代提出的问题的回答已具有初步的系统性;衡量理论的系