【摘 要】
:
近年移动终端的逐渐普及和网络的蓬勃发展催生了新型互联网结构的诞生,促进了网络流量的增长。在如此庞大的网络背后,对网络流量的有效监管是网络安全保护的基石。目前网络监管方向的许多研究都专注于未知网络协议类型的分析,与机器学习相结合的协议识别方法是此类研究中的热点,该方法提取数据流特征并建立数据集,使用机器学习的算法模型分析未知网络流量,可以得到相对于传统网络协议分析方法更好的识别效果。本文的研究主要聚
论文部分内容阅读
近年移动终端的逐渐普及和网络的蓬勃发展催生了新型互联网结构的诞生,促进了网络流量的增长。在如此庞大的网络背后,对网络流量的有效监管是网络安全保护的基石。目前网络监管方向的许多研究都专注于未知网络协议类型的分析,与机器学习相结合的协议识别方法是此类研究中的热点,该方法提取数据流特征并建立数据集,使用机器学习的算法模型分析未知网络流量,可以得到相对于传统网络协议分析方法更好的识别效果。本文的研究主要聚焦于不同协议类型和应用数据加密方法的分析。不同的数据流由于其承载应用的不同,在持续时间,数据分布,应用数据安全性,客户端、服务端交互等特性上都会存在一些差别。针对这些差别,本文提出一种识别算法模型实现对不同协议流、不同应用密文加密算法类型的识别与分析。首先,针对未知网络协议识别问题,本文在深入研究K-Means算法后提出了基于KMeans算法聚类过程和离群点分析的未知协议识别算法模型。K-Means算法流程简单,运行高效,作用于大数据集上效果较好,但K-Means算法在流量识别中存在着一定缺陷:K-Means算法对初始聚类中心点的选择采取随机的策略;执行同样功能的数据流在不同的网络环境下会表现出不同的特征,因此数据集中异常点较多,而算法的结果易受到该因素的影响;特征构建过程中冗余维度的存在,维度之间量纲的差别等因素也会影响到识别的精确率。为了弥补上述缺陷,本文引入特征归一化预处理、特征选择、LOF离群点分析等操作,聚类过程使用K-Means++算法,并借助离群点分析中的最大局部可达密度点来实现初始聚类中心点的准确定位。其次,针对流量应用数据所使用的加密算法类型的识别,本文在未知协议识别的基础上,提出了基于随机森林的算法模型。若直接对所有网络数据进行加密算法类型识别,由于非加密应用数据的存在,不仅影响识别的准确性,也会因为处理了太多的无关数据影响到算法的执行效率。故本文提出的加密算法类型识别模型建立于第3章的协议识别模型之上,在聚类算法的结果中针对其中进行了应用数据加密的协议类别,依据协议流特性对其密文进行特征构建,建立随机森林算法模型对不同的加密算法进行分类。分类方法建立在聚类算法的基础上,规避了未加密的应用数据,既减少了算法处理的数据量,也可以得到更好的识别结果。本文所使用的数据集均由对原始数据进行特征工程处理得到,在尽可能提取模型特征的情况下,也对数据集进行了一定程度的加工和优化。最终的实验结果表明,改进算法模型在未知协议识别的精确率上有一定提升,对加密算法类型也有较好的识别效果。通过整个算法模型,可以有效的识别互联网不同协议流的类型,并可以初步的识别和分析其中的应用数据密文。
其他文献
大量实验已经证明进气滚流可以有效促进缸内燃油混合和燃烧,从而增强发动机性能。本研究在一台直喷光学发动机上对滚流对燃油混合和燃烧进行了可视化研究。可变进气滚流是通
随着我国林权制度改革的不断的深入和完善,林地流转越来越成为国家、党、政府、专业研究人员、农户所关注的主题,《关于全面推进集体林权制度改革的意见》中明确就要求和指出
近年来,随着互联网的高速发展,网内数据量急剧增加,用户访问网络所关注的重心已转变成内容本身;面对互联网需求的改变,传统面向端到端连接的TCP/IP网络已经无法满足大数据时
过去数十年,信息通信技术(下称ICT)飞速发展,作为经济发展中的朝阳产业,成为各国新的经济增长点。信息通信技术给社会生活、政治经济都带来了深刻的变革,蕴含了巨大的战略和
目的:阐明寰枢外侧关节形态变化对寰枢关节运动范围和稳定性的影响及寰枢侧块关节间结构性支撑植骨的生物力学意义。方法:从南方医科大学解剖教研室中选择6具新鲜人尸体枕颈部标本(枕骨髁基底C0-C3),每具标本依次制作成完整状态、失稳状态、枢椎侧块截骨、后路寰枢椎椎弓根钉棒内固定、后路寰枢椎椎弓根钉棒内固定+侧块关节间植骨五种模型,行前屈/后伸、左侧弯/右侧弯、左/右轴向旋转生物力学研究,测量寰枢关节的三
宽带隙(3.2 eV)的铜铁矿结构CuCrO2是一种p型透明导电氧化物(TCOs),由密排[Cu+]层和[CrO6]共棱八面体层沿c轴交替堆垛而成,能自发形成Cu空位提供空穴载流子,主要导电通道为[Cu+]
改革开放以来,经济发展越来越快,土木工程也在迅速发展。但随着时间的推移,越来越多早期建造的建筑物已经迈入或即将迈入老龄化阶段,从经济性和时效性的角度,考虑到建筑物周围的自然和人文环境,许多建筑物不适合重建,所以建筑行业的维护和加固工作比例逐年增加。本文主要针对粘钢加固方法,在现有的施工工艺的基础上,对传统的粘钢加固技术进行了改进。在胶层中加入石英砂,以期通过石英砂的加入可以使胶层性能改善,增大胶层
随着中国地铁运营能力的提高,大城市的人们更多地选择地铁出行。有些地铁线路在早、晚高峰时运营负荷量大,造成部分早期建设的地铁车站环境质量下降。地铁车站内环境参数受空
目的:讨论青海地区藏族、汉族高血压患者及健康人群过氧化物酶体增殖物激活受体γ2(Peroxidase proliferators activate receptors,PPARγ2)基因的多态性与原发性高血压(Essential hypertension,EH)关系。方法:随机选择2017年12月至2018年12月期间青海大学附属医院心内科住院治疗的藏族高血压患者、藏族健康人群、汉族高血压患者、汉
潜热通量是地球表面能量预算的重要组成部分,也是水文循环中重要的一环。完整的潜热通量数据是估算作物生长模型和水文模型的重要参数,对于精准计算农作物需水量,农业用水调控和区域水资源管理有重要意义。但由于天气及其它原因,检测潜热通量数据的涡度相关仪会受到不同程度的损坏,造成数据的缺失,难以提供完整的潜热通量数据。因此,潜热通量缺失数据的补全就成了亟需解决的问题。传统的潜热通量插补模型需要大量的气象数据,