基于时间序列的海量网络流量分析系统的研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:zhangliu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的高速发展,各种网络应用层出不穷,中国乃至全球的互联网使用人数与日俱增。据CCNIC发布的第36次中国互联网络发展状况统计报告,截至2015年6月,中国网民规模达6.68亿,半年内总计新增网民1894万人。互联网普及率为48.8%。随着互联网的越来越普及,人们在日常生活中和互联网之间的联系也越来越紧密,互联网产生的网络流量数据也越来越大。对于这些包含个人信息的海量网络流量数据,如何对其进行处理、分析及存储也是运营商关心的一大难题。Hadoop的出现在一定程度上解决了海量网络流量数据的处理这个难题,但是随之新的问题出现了。Hadoop的批处理机制使得其更适合处理海量的离线数据,而对于实时的海量数据处理,则表现不尽人意。而Storm流处理平台的出现刚好弥补了 Hadoop实时性不足的缺点,成为大数据时代实时海量数据处理的新利器。本文首先介绍了海量网络流量的大环境,包括异常网络流量的危害以及异常检测研究现状。接着,介绍了大数据处理的一些相关技术。随后,分析了传统的异常网络流量检测法的不足,并在充分了解网络流量的时间序列性之后,提出将格拉布斯异常值检测法和动态K近邻相结合的新型检测算法,作为异常流量实时检测的算法,并对算法合理性和正确率进行了验证。之后,详细介绍了异常流量实时监测系统,包括Kafka消息系统,Storm流处理平台和Hbase非关系型数据库,以及基于K近邻-格拉布斯检测法在这套Storm框架系统下的实现。最后,本文对异常网络流量实时检测系统的实验所得数据进行了分析。本文所有的数据均来自于某省的两千多家企业网的日常真实流量,所以可以保证数据的真实性和海量性。本文中所有的测试也都是在自主搭建的Storm实时处理平台上完成的。并且,实验数据结果显示,这套系统能够正确的完成异常流量的实时监测的任务。
其他文献
企业的财务目标是追求股东财富最大化。从融资决策方面看,资本成本作为重要的公司金融概念,在很大程度上影响着企业的财务战略和经营绩效。因此,在现实环境下,企业必须更加清
罗丹明以其良好的光稳定性、光物理性质和荧光效应得到了人们的极大重视。基于罗丹明的螺环衍生物与被检测物质作用开环而产生荧光响应的特性,将两个或多个罗丹明母体单元构
高名凯主编的《语言学概论》在业界影响深远,本文主要从高名凯《语言学概论》的理论体系、结构框架等方面阐述该教材的深厚影响。同时也从政治色彩、语料使用等方面介绍高本
<正>石屯六朝墓位于福建省政和县石屯镇长城村、蝴蝶街村和松源村,在七星溪南北两岸背靠高山的低缓山丘上(图一)。2009年10月、2010年7~11月,福建博物院考古研究所为配合宁武
互联网时代,企业财务融资环境发生了巨大变化,本文针对这一现状展开进一步分析,探讨了企业财务融资加强基础工作,积极迎接时代挑战的科学对策。对全面提升企业财务会计工作整
Sirtuin蛋白是一类称为依赖烟酰胺腺嘌呤二核苷酸(NAD)的组蛋白去乙酰化酶,共有7个成员,均是潜在的疾病治疗靶点。然而,目前的荧光筛选方法,只适用于SIRT1~SIRT3。因此,根据S
目的探讨白凡士林纱条配合换药治疗表皮坏死创口的影响因素。方法20例表皮坏死创口用白凡士林纱条换药3~4d后,改用0.1%利凡诺纱条换药至愈合。结果20例表皮坏死创口经白凡士林纱
地磁管理器设备是针对地磁检测器而设计的,主要功能是搜集名下所有地磁检测器上传的车位信息,并通过有线或者无线的方式传输至后台,也可以通过后台来配置名下的地磁检测器广
拔罐,也叫拔火罐,在我国历史悠久,远古时候中国人即会用动物的犄角(如牛角等)制成筒状,用于吸伤口内脓血和治疗痈疽,故拔罐法古称“角法”。$$拔罐疗法历史悠久$$拔罐疗法的记载最早
报纸
期刊