FLOWGAN：基于生成对抗网络的加密流量识别关键技术研究

来源 :南京邮电大学 | 被引量 : 1次 | 上传用户：lyfqxx3

【摘要】

：

移动设备的迅速普及极大地改变了各种网络服务的接入方式,导致了移动业务流量的爆炸式增长。在过去的几十年里,移动服务流量分类一直是移动网络管理、安全监测领域的研究热点

【作者】

：

王梓炫

【出处】

：

南京邮电大学

【发表日期】

：

2020年01期

【关键词】

：

加密流量识别深度学习生成对抗网络流量分类类别不平衡

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

移动设备的迅速普及极大地改变了各种网络服务的接入方式,导致了移动业务流量的爆炸式增长。在过去的几十年里,移动服务流量分类一直是移动网络管理、安全监测领域的研究热点。然而,随着越来越多的移动服务采用加密技术,移动流量分类面临很多挑战。虽然经典的机器学习方法可以解决基于端口和有效载荷方法不能解决的许多问题,但它仍然存在一些局限性,如复杂的特征需要手工提取十分耗时耗力、特征更新频繁等。深度学习(Deep learning)具有良好的自动特征学习能力,无疑成为移动服务流量分类,特别是加密流量分类的理想方法,但仍然存在一些局限性,其中之一就是网络流量数据的不平衡性。数据的不平衡会导致将小样本类别的应用错误识别为类似的大样本类别的应用,从而影响分类结果。而且加密流量的标记十分困难,而没有标记的加密流量却十分容易获得。据此,本文提出了一种称为Flow GAN的深度学习方法来解决加密流量分类识别中类别不平衡的问题。Flow GAN作为生成对抗网络(GAN)的一个流派,利用了GAN数据扩充的优势,对小样本进行补充,形成平衡数据集;使用基于SGAN的半监督学习方式,可以利用少量有标记样本和大量无标记样本进行分类;利用MLP,CNN,SAE等多种深度学习分类模型对平衡后的加密流量进行分类,输出分类结果。本文的主要工作如下:(1)着重对样本数据不平衡的情况下,小样本识别率偏低的问题进行研究,提出使用GAN来扩充加密数据流量,以解决加密流量数据样本不平衡的问题。(2)针对有标记样本少而无标记样本多的特点,使用SGAN通过优化其网络结构和参数,使其与半监督学习相结合,利用少量有标记样本和大量无标记样本,训练判别器进行分类实验。(3)使用基于MLP,CNN,SAE三种分类模型在使用不同数据平衡方法的数据集(过抽样平衡方法,SMOTE平衡方法,基于GAN的平衡方法)上进行分类验证,以此来检验FLOWGAN的性能。实验结果表明,在ISCX数据集上使用SGAN方法进行半监督学习,和基于CNN的分类器进行识别准确性对比,在标记样本数量较少时,准确率有明显提高;使用基于GAN的平衡实验结果表明,小样本应用的分类在MLP方法下效果提升显著,三项分类指标(Precision,Recall,F1-Score)和基于非平衡数据集上的实验结果相比分别提升了20-30%,其中aim＿chat,facebook,icq这三个小样本应用,在使用CNN和SAE分类方法时也分别有2-3%的提升。

其他文献

S市邻避冲突事件发生的原因及应对策略研究

在最近几年中,国内经济的变革以及社会的转型不单单使得社会的财富增加,同时亦造成环境的质量急剧减弱的后果。在较长的一段时间内,国内经济的发展主要是高耗能、高污染的模式,而国内工业化发展模式代价主要是环境的受损和污染后果,从而导致国内经济并未有效性地实施可持续性的发展策略,甚至因为环境的质量问题而造成了更为严峻的后果。由于环境问题而造成的群体性事件始终呈现出增长的态势。其中,邻避冲突便是最为明显的一个

学位

S市邻避冲突环境群体性事件应对策略

从《搜神记》的归类看古代目录学的小说观

《世说新语》是杂记体,而《搜神记》则是杂传体,所以《隋书·经籍志》把《世说新语》归入子部小说类,却把《搜神记》归入史部杂传类。唐代以后对历史的要求日益严格,来自

期刊

杂记杂传史部子部小说

中亚华裔留学生初级阶段汉字笔画、笔顺习得研究

中亚华裔留学生初级阶段汉字书写不规范,汉字书写偏误的现象普遍存在。为探索此现象背后的根本原因,本文以西北师范大学初级阶段的中亚华裔留学生为例,搜集留学生一年内课堂

学位

中亚华裔初级阶段笔画笔顺书写偏误

基于灯光罩网的南海中南部游泳动物种类组成及主要优势种的时空分布特征

南海因其特殊的地理环境孕育了丰富的生物物种,而中南部海域拥有储量较多的游泳动物资源,其开发利用前景广阔。但是,有关该海域游泳动物的种类组成及其优势种生物学和生态学

学位

南海中南部游泳动物数量分布季节变化环境因子广义可加模型

瘀点性出血高温作用后的病理形态变化

目的观察机械性窒息主要征象——瘀点性出血经过高温(烘烤、水煮)作用后的病理学特点及其变化规律。方法采用扼压颈部以及前位缢型缢死的方式建立家兔机械性窒息死亡动物模型

期刊

法医病理学高温机械性窒息瘀点性出血死后焚尸兔

中国边境治理研究:从单一视角转向复合视角

当前的研究多将边境治理视为一种"单一结构",即针对边境特有问题,尤其是"跨境"问题的专项治理活动。这种单一视角对于边境治理的定位并不准确,同边境治理实践并不吻合,所形成

期刊

边境治理地方治理边疆边界行政区划

国有股流通并不意味马上上市

本报北京6月17日讯（记者张敏）今天，国务院国资委出台了《国务院国资委关于国有控股上市公司股权分置改革的指导意见》。国资委有关负责人指出，国有股股东所持有的股份虽然获得了

报纸

《汉字轻松学·起步篇》分析与初级对外汉字教学

汉字教学是对外汉语教学中极为重要的一环,虽然近年来汉字教学已逐渐受到人们的关注,可是其发展仍处于相对落后的状态,而作为汉字教学重要载体的汉字教材也处于同样的境地。

学位

《汉字轻松学·起步篇》教材分析汉字教学

蒙语授课中学化学教学中趣味化学实验内容的案例研究

在当今教育改革的大潮下,化学实验作为化学学科拥有的特性,越来越受到人们的关注。义务教育化学课程标准和普通高中化学课程标准(2017)也明确指出化学实验对学生科学素养与核

学位

趣味化学实验中学化学蒙语授课科学探究课堂教学

信息技术在小学语文教学中的有效应用

随着现代教育信息化的深入,进行信息技术与各个学科之间的融合促进,成为研究者和教师的一个研究焦点。系统阐述了小学语文教学中信息技术与语文教学相结合的各种形式。针对多

期刊

信息化技术小学语文应用模式教学整合

FLOWGAN：基于生成对抗网络的加密流量识别关键技术研究

与本文相关的学术论文