基于Text-GAN的加密流量识别关键技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:shiqiuqiu100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着手机的不断普及,越来越多的手机应用涌入市场。用户在使用应用的同时,会产生大量记录着用户操作信息的流量。通过分析用户产生的应用流量,可以得到用户的操作习惯、使用的应用类别等信息,故有巨大的挖掘价值。然而随着流量加密技术的发展,越来越多的公司对用户产生的流量进行了加密处理,为识别带来困难。传统的应用流量识别方法如:基于端口号和应用层协议标签的网络流量识别技术已无法使用在加密流量领域。越来越多的研究人员开始转向将机器学习、深度学习的技术应用在加密流量领域。这类方法可以很好的解决传统流量识别方法无法应用在加密流量上的问题,但相比传统方法实现简单的特点,使用机器学习或深度学习技术需要大量的数据做支持,以供模型学习到各类流量的特征。不仅如此,用于训练的流量数据需尽可能达到各类别间数据集平衡,以获得较好的训练效果。然而流量数据的抓取与标记是一件非常耗时的工作,同时由于不同应用的用户数量不同,随之生成的应用流量也有多有少,这就导致建立的数据集容易出现数据不平衡问题。据此,本文提出了基于生成对抗网络的流量识别系统。首先针对流量数据集类别不平衡问题,使用基于Self-Attention技术改进的TEXT-GAN,对流量数据进行数据扩充与平衡,然后结合长短期记忆网络LSTM对平衡后的流量数据进行识别。采用“ISCX VPN-non VPN traffic dataset”公开数据集进行模型的训练和验证,精准率可以达到0.9948,召回率可以达到0.9937,F1-score可以达到0.9937,与传统的MLP方法相比,本模型在三项评估指标上都有明显的提升。并进一步将该方法应用到人工抓取的电商APP产生的加密流量数据上,对流量中的用户行为进行识别。本文的主要创新如下:1、设计出基于Self-Attention技术改进的TEXT-GAN的流量生成方法,使用支持并行计算的Self-Attention机制替代原有生成网络中的无法并行计算的LSTM层,提高流量数据生成速度与生成质量。2、结合长短期记忆网络LSTM对平衡后的流量数据进行识别。相较于以往使用的神经网络如MLP,长短期记忆网络LSTM考虑了流量中的语序信息,在应用识别上可以达到0.9937的F1-score,更加适合在加密流量数据分类的场景下应用。3、将流量识别从对应用的识别拓展到对用户行为的识别,以体现整套系统的普适性。本文使用现网采集的实际用户APP行为流量数据进行识别和分析,并在精准率,召回率,F1-score上对识别结果进行评估。
其他文献
照明控制技术的智能化在节能减排的工作中占有举足轻重的地位,但目前照明控制系统中常用的红外传感、声音传感等技术对照明场景中人物活动的感知准确度有待提高,传感器的检测距离也比较近。随着机器视觉技术与深度学习理论的发展,图像识别技术有望在照明控制系统中弥补以上不足,但目前的深度学习模型对数据量、运算力、训练时间的要求过大,给图像传感系统的开发造成了一定的难度。针对以上问题,设计了一种基于图像识别的智能图
截至11月22日,七师一二九团有八户困难职工通过工会专项帮扶资金审核。据了解,为扎实做好此项工作,该团各单位工会从11月初开始根据困难职工档案有关规定,在深入走访的基础上
儿童在享受着科技发展带来便利的同时也承受着巨大的竞争压力,他们很少有机会真正地走入自然。植物科普平台一方面为儿童充分接触大自然提供各种数字工具和帮助,另一方面能够
目的 探讨胆汁反流性胃炎的病因和发病机理。方法 对217例胆汁反流性胃炎患者的临床资料进行回顾性分析。结果 217例患者中有84例(38.7%)有吸烟史;其幽门螺杆菌阳性率30.9%,而非胆汁
按照《师市总工会"不忘初心、牢记使命"主题教育实施方案》要求,12月16日,八师石河子市总工会组织在家全体党员召开了"不忘初心、牢记使命"专题组织生活会。会上,全体党员按
随着城市人口密度的增加,人们对公共交通的需求增大,地铁因便捷、快速、载客量大的优点成为人们日常出行必不可少的交通工具。地铁轨道交通是一个较为密闭的地下空间,室内环
为落实健康中国战略,国家卫健委发布了《健康中国行动2019-2030》这一纲领性指导性文件,进一步强调“三减三健”行动,倡导健康文明生活方式。而当下我国居民的健康素养水平总
三线建设是我国历史上璀璨而神秘的一段历程。都说历史是人民创造的,而创造了这段历史的人们,大多都被淹没在历史的洪流中。近几年,三线建设题材纪录片开始逐渐在大众视野中显现,但是大多在描述宏大的历史变迁。本次毕业设计影片《前锋岁月》将镜头聚焦在历史帷幕后的普通人身上,追寻他们现在的踪迹,展现他们目前的生活状态。本文作为影片的创作阐释,共分为三个部分。第一部分的主要内容是关于影片的创作背景、创作意义和相关
目的探讨心理护理模式在慢性乙型肝炎患者治疗中的应用效果。方法选取2013年12月—2014年12月攀枝花市第四人民医院收治的慢性乙型肝炎患者78例,随机分成心理护理组和常规护
光呼吸是绿色植物在有光的条件下吸收氧气并且释放出二氧化碳的代谢过程。该代谢过程十分复杂,涉及到叶绿体、过氧化物酶体、线粒体以及细胞质,其代谢的总结果是生成了一分子