云中心网络流量分类方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:flypoet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着云技术的高速发展,各大企业也都纷纷建立属于自己的数据云中心。在云中心的环境下,应用行为和应用流量的数据规模也在逐步增长,怎样从云中心的网络流量中挖掘出有价值的信息已成为各大企业追求的目标,同时,对云中心的网络流量进行分类也是实现云安全和云管理的关键。然而由于云环境下的网络流量数据规模大、应用种类繁多,利用传统的网络流量分类方法对云中心的流量进行分类,不仅无法确保分类准确率也无法满足实时性要求。如何兼顾网络流量分类的准确率和实时性是云中心网络流量分类的一个技术难点,对此论文给出了一种基于CDH(Cloudera’s Distribution Including Apache Hadoop)平台的网络流量分类方法和基于随机森林的网络流量分类方法。论文的主要工作及创新点如下:(1)针对校园网网络环境下的Internet流量分类要求,本文给出一种云环境下基于CDH平台的网络流量分类方法,构建了CDH大数据平台,通过网络协议数据分析工具抓取实际的网络流量,提出一种基于模式匹配的网络流量分类算法PM,然后利用大数据实时计算框架Spark Streaming对PM算法进行并行化,实现实时网络流量分类。与传统分类方法相比,该方法在流量分类效率和分类精度上都有所提升,所提出的模式匹配算法PM,不仅可以对离线的网络流量进行分类,还可以对实时的网络流量进行分类,为实现实时网络流量分类提供了思路。(2)针对Ceph云存储系统数据优化分布需要,给出一种基于流统计特征的存储节点之间流量分类方法,该方法利用wireshark抓包软件抓取Ceph云存储系统中实际节点之间的流量,并对抓取的流量进行流特征统计分析,选用包大小、包个数、流的持续时间三个组合特征,利用随机森林算法实现对网络流量的分类。实验结果表明,所选的组合特征结合随机森林算法能够很好的将Ceph云存储系统节点之间的流量进行分类。
其他文献
<正>北京后海南沿26号院,张伯驹潘素故居,朱门灰墙,静谧怡人。在院子里一棵已有百年的丁香树下,张伯驹潘素的独女,79岁的画家张传彩老人,把与父亲张伯驹在一起的日子对我娓娓
随着十八届三中全会提出要建立城乡统一的建设用地市场,农村集体建设用地的入市已经成为我国社会现阶段经济发展的必然趋势,也将深刻影响房地产市场的变革。在了解相关背景和
随着我国经济的快速发展及国民对住房需求的提高,在取消了福利分房的政策后,我国房地产行业发展进入了快速上升期,并成为我国社会经济的支柱型产业之一。作为资金密集型行业,
目的:探究高血压合并腔隙性脑梗死(LI)患者认知障碍的相关因素。方法:选取2016年9月-2017年9月在本院接受治疗的290例高血压患者作为研究对象,根据患者是否同时存在LI将所有
涉税职务犯罪是一种严重危害社会的犯罪行为,它不仅直接败坏国家声誉,降低政府威信,损害公众对国家机关工作人员职务活动公正性的信赖,而且严重导致公共财产、国家和人民利益
<正>2017年,建设银行坚决贯彻党中央、国务院关于金融风险防控的决策部署,落实党的十九大精神和习近平总书记对建设银行"增强服务国家建设能力、防范金融风险能力、参与国际
当今快节奏的生活方式中,如何在当代版式设计中更好地传达设计者的意图,体现版式设计的功能性,避免混乱的表达方式,使受众者一目了然,是本文要解决的问题。
刘少奇《论共产党员的修养》是中国共产党首部从党员个人角度论述党的建设的论著。该书系统阐明了党员自我修养的必要性、主要内容和基本方法,发展了马克思主义党建理论,完善
本文在对广西药用植物园及其周边环境充分调研的基础上,立足传统园林文化、中医药文化和国际旅游文化的构筑,以翔实的资料从5个方面阐述了广西药用植物园规划的立意和功能定
本文主要探讨内部资本市场效率的分析模型。通过对内部资本市场"有效"的观念总结和理论判断,揭示了企业内部资本流动现象隐含的动力机制和逻辑关系,分析了我国企业内部资本市