基于深度学习的加密流量分类技术研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:chunlai_zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,各类网络业务和应用所产生的网络流量呈现爆发式增长,同时,信息的安全性问题也受到越来越多的关注,密码技术在保护隐私和数据传输安全方面得到了极大的应用,因此,加密流量在网络传输中的比重越来越大。但是这在保障信息安全的同时,却也给异常流量检测和网络监管带来了严峻挑战,很多病毒、蠕虫等恶意软件利用加密和隧道技术绕过安全设备的检测和防御,因此对加密流量进行检测识别成为业内研究的热点。当前传统的基于端口和DPI的方法无法对加密流量进行识别,基于浅层机器学习的方法,尽管对加密流量的分类达到了一定效果,但是存在人为提取特征导致准确率不足的问题。近年来研究人员利用深度学习算法在加密流量领域做了大量探索性研究,但是这些研究都只单一考虑加密流量某一类特征,比如传统CNN模型只考虑加密流量空间特性,LSTM模型单一考虑时序特征,从而存在特征学习不全面导致准确率不高的问题。针对以上问题,本文通过充分分析加密流量的空间与时序特征,同时研究空间与时序特征中的重要性特征对分类的影响,提出了一种将CNN、LSTM模型与注意力机制相结合的模型。综上所述,通过本文提出的模型对于加密流量相关的分类识别提供支持,具有一定的应用场景与现实意义。本文研究内容以及所得结论是:1.提出了一种针对加密流量的应用分类任务的完整实验方案。其中含数据采集、数据预处理、模型训练(包括特征学习和分类)和测试阶段。首先,利用ISCX VPN-NonVPN公开数据构建实验数据集;其次通过利用USTC-TK2016工具对原始数据集进行预处理,得到数据向量矩阵,存储于IDX文件;然后利用10交叉验证法随机抽取训练集和测试集,将训练集数据输入基于注意力机制的CNN-LSTM模型进行特征学习;最后,对学习获得的特征开展模型训练,利用测试集验证模型效果。2.提出一种基于CNN、LSTM和注意力机制算法的分类模型。首先,根据加密流量不同应用数据包大小、流大小以及数据包个数等空间特征的差异性,利用CNN模型中的卷积层学习加密流量的空间特征,提取数据局部特征,并组合抽象成高维特征,之后引入注意力机制,根据注意力权重加权计算卷积层的输出特征得到加权后的高维特征,再利用池化层对高维特征进行降维得到CNN层的输出结果;然后通过研究加密流量数据包平均到达时间、数据包传输的时间间隔以及流量请求先后顺序等时序特征的不同,利用LSTM模型学习加密流量的时序特征,将CNN输出结果输入至LSTM模型进行时序特征提取,同样考虑时序特征中的重要性特征的影响,比如包头的信息重要性程度高于尾部的的少数数据信息,因此引入注意力机制,根据注意力概率加权计算LSTM模型输出特征的重要性,从而获取加密流量整体特征。最后对局部特征和整体特征进行融合,将融合结果输入分类器中用于分类,基于相关分类器函数得到输出结果。3.设计并实现了一个基于注意力机制的CNN-LSTM的加密流量分类系统。系统包括在线加密流量采集、数据预处理和测试模块,验证了本文所提方法的可用性和有效性。同时与已有文献提出的HST-R方法,以及CNN算法、LSTM算法和CNN-LSTM算法等常用深度学习算法进行了对比分析,所得结果表明本文所提方案分类准确率显著提高,具有一定的应用参考价值。
其他文献
三角洲作为世界上重要的含油气沉积体系,一直是地质前辈研究的重点对象,但多年来研究的都是粗粒沉积的三角洲,近些年来才逐渐对细粒三角洲展开研究,但目前对泥质三角洲沉积仍缺乏整体认识。海拉尔盆地大磨拐河组地层表现出明显的泥质三角洲沉积特征,因此本文在前人研究基础上,通过数值模拟对大磨拐河组沉积过程进行研究,建立沉积动态演化过程,并分析不同控制因素对其沉积的影响,为更精确地表征泥质三角洲提供一种新的思路和
近年来,我国的电子商务技术不断发展,网络购物的市场竞争也越来越激烈,许多商家都纷纷开展网络促销活动,以多种网络促销方式来吸引消费者。本文中的网络促销是指在一定时间范围内电子商务平台展开的整体的促销活动,其中最具典型的就是“双11”促销。2009年,“双11”促销开始实施,而且历经了近十年的演化和发展,如今“双11”已经成了一个全民购物狂欢的重要时间点。网络促销虽然可以有效地刺激消费者的冲动性购买,
苯并噁嗪酮衍生物作为重要的含氮杂环化合物,具有抗心血管疾病和抗癌的活性,被广泛应用于药物领域。酚羟基作为生物活性分子、天然产物和药物中的重要官能团,大多数具有抗肿
党的十八大对于全面提升高校师德水平提出了新的要求。教育部《关于建立健全高校师德建设长效机制的意见》和《新时代高校教师职业行为十项准则》等重要政策文件,将加强高校教师职业理想和职业道德建设的要求引向了新的高度。这些制度和政策的要求对于加强和改进高校师德建设,引导广大教师自觉践行社会主义核心价值体系,加强自身修养,弘扬高尚师德,提高高等教育质量具有重要现实意义;对于深入开展社会主义核心价值观教育,全面
美国虽然不是世界上最早确立选举公共资助制度的国家,但是这一制度在美国较为健全,所以引起广泛关注。选举公共资助制度在美国的发展,可以总结为“起于联邦,兴于州”。联邦层
语言作为人类思想和科技成果的重要载体,是人类社会的宝贵资源。随着多元文化主义的发展,全球语言文化交流的日益频繁,维护语言文化多样性、保护语言资源已成为一些多民族国家关心的课题。许多国家开始通过双语教育来保护本国主流语言与少数族裔语言的共同发展。美国是世界上语言资源最丰富的国家之一,具有多样性的语言生态。美国双语教育历史较长,涵盖民间教育活动和政府教育法规,两者都具有起伏发展的历程,彼此间又时而相互
太阳耀斑是太阳系里最激烈的爆发活动之一,可以在太阳大气中数分钟到数小时内释放出1028到1032尔格的能量,太阳耀斑的预报作为空间天气中的关键问题已经被研究了数十年。然而,如果耀斑是自组织临界系统(self-organized critical,SOC)所预期的随机过程,这种确定性的系统预报依然是存在争议的。因此,有必要了解耀斑的发生是与之前发生的事件有关还是随机过程。从统计学的角度来说,等待时间
宋话本是中国文言小说系统和白话小说系统的分水岭,在我国古代小说史上占据重要地位,其中涉及北宋都城东京和南宋都城临安的两京故事,占据了宋话本总数的绝大部分。空间叙事是近几年叙事学领域研究的热点,与中国古代文学的结合研究日渐增多。本课题以目前中西方的空间叙事理论为基础,对宋话本中两京故事的空间叙事进行研究。全文共由绪论、正文、结语三部分组成。绪论部分主要说明本课题的研究目的和研究意义,梳理相关领域的研
声表面波马达可通过结构简单的叉指电极直接激发声表面波产生驱动信号。因而,声表面波马达除了具有超声马达的优点外(比如高输出力,高速度等等),还有一些其它的优点,比如纳米级的精确定位,易于小型化等等。此外,非接触式声表面波马达通过定子与转子之间流体层中的声流来驱动转子运动。由于不需要依靠转子与定子间的接触摩擦来提供驱动力,故与接触式声表面波马达相比具有无摩擦损耗、寿命更长、转速更高等优点。这也使得非接
随着核电的大力发展,核电站在全球范围的大规模建立,核电站和乏燃料后处理厂每年将要产生大量的放射性非工艺低放废液,其中放射性洗衣废水的处理需要尤为关注。在放射性洗衣废水的处理实践中,只使用单一方法处理放射性洗衣废水一般并不能达到预期的效果,因此需要将多种工艺组合起来,以达到预期效果。本文采用了气浮、膜分离、吸附方法对放射性洗衣废水模拟液进行单一工艺和组合工艺的处理。通过单一方法的使用,对模拟洗衣废水