基于流记录的网络流量识别关键技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:fdgbh54g45g44
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流量识别对互联网的网络安全和网络管理领域具有重要意义。随着新的网络应用的出现和网络应用技术的不断的发展,传统的识别方法的局限性日益体现,端口识别由于P2P等应用对端口的使用方式而失去了自身的优势,DPI技术虽然可以有效的识别网络流量,但是无法处理加密的流量。基于机器学习的识别方法可以有效地改善这两种技术存在的缺陷,而面对众多这类算法,如何从中选择或者加以改进以适合特定实际流量环境仍是该领域未能完全解决的问题。另外目前抽样技术已经广泛用于高速的网络测量和网络管理中,在抽样的网络环境下对于基于流的特征属性的影响以及测度之间的相关性的影响也是该领域目前的一个研究热点。本文的研究工作围绕以上目标展开,通过建立标准数据集,研究基于流记录的流量识别方法。具体的研究工作包括以下几个方面:  1、属性选择算法对网络流量识别的影响:在目前基于流记录的网络流量识别中,测度属性的选取对其尤为重要,由于每个测度属性都有很高的计算复杂度及空间复杂度,这样就对在线流量识别提出挑战,而属性选择算法能依据一定的评估策略选择出更能区分流量类别的属性,通过降低属性的维度来降低其计算复杂度和空间复杂度,并提高分类和识别的正确率,本文分别提出基于类均值向量的FBRI属性选择算法和流区分信息属性度的MSAS属性选择算法,并和传统的FCBF算法进行了比较,实验表明本文所提出的属性选择算法能更好的区分行为测度属性和类属性之间的相关性。  2、抽样对网络流量识别的影响:在目前的网络管理中普遍采用报文抽样作为一种手段来降低测量的高负载以及测量的数据量。因此把目前的流量识别技术应用到带有抽样机制的网络管理系统中,势必要分析抽样对流量识别的影响以便于更好的适应系统的要求,鉴于此,本文分别对三种常见的抽样方法对流行为特征测度的相关性影响进行了实验分析,并通过对常见识别算法的结果分析,考察抽样对流量识别的影响。  3、基于有监督的识别算法:目前大部分研究仍采用有监督流量识别方法对流量进行识别,然而还存在属性计算复杂度高,识别精度较低等不足,本文为提高识别精度提出一种基于改进的BP神经网络方法(PCA BP),该方法通过在BP神经网络前段采用主成分分析方法对高维属性进行降维,构建最佳的主成分,并作为BP神经网络新的输入。实验结果表明通过前置PCA能改善BP神经网络的识别精度,提高识别效率。  4、基于无监督的聚类算法:随着新的网络应用不断产生,例如P2P应用,这些应用由于属于没有标记的样本,因此无法采用有监督的机器学习方法,对标准样本集进行训练,进而产生相应的分类器对流量进行识别,因此为了解决对新的网络应用的识别问题,本文提出一种基于改进的KMEANS的聚类的流量识别方法,该方法通过把初次聚类的结果进行模拟退火处理,从而避免了由于K参数选取所造成聚类结果的盲目性,改善了聚类算法本身对于流量的聚类结果的正确性。  5、多分类器算法模型:目前单分类器在识别精度上已经进入一个瓶颈,不同的分类器有一定的偏好性,如果能够充分利用各分类器的优势,这样将对识别在性能方面得到一定的提升,因此本文提出多分类器算法模型,采用证据理论进行融合,把偏好性和时间度作为评估的权值,实验结果表明该模型能提高分类精度,降低单分类器所引起的偏好性。
其他文献
近年来,随着信息技术和电子技术的快速发展和不断成熟,嵌入式设备已经延伸到了人们日常生活的各个领域。嵌入式设备应用的类型和应用范围的不断扩大也使得嵌入式设备的市场竞争
随着计算机软件产业的发展,软件的规模日益增大,软件的质量也受到人们越来越多的关注,往往一个细微的漏洞都有可能被恶意攻击者利用,给用户造成难以估计的损失。因此运用测试技术
随着互联网的飞速发展,人们正面临着包括图像在内的各种多媒体数据的爆炸式增长。如何快速,有效地从海量的图像数据中检索出所需要的图像是目前一个急需解决的重要问题。然而底
随着信息技术的迅速发展,很多领域都出现了容量庞大的数据管理系统,为帮助用户从这些含有噪声的海量数据中分析出有价值的知识,数据挖掘(DataMining,DM)技术应运而生。聚类(C
随着微博平台中用户的爆炸式增长,其用户创造的信息也随之呈指数级增长。从而导致过量的数据使得用户无法有效地获取自己想要的信息,即信息的使用率反而降低,信息过载的问题则日
随着计算机科学技术的迅猛发展,自动指纹识别技术从上世纪80年代以来取得了很大的进步。目前,包括我国在内的很多国家都有公司或者机构专门从事自动指纹识别方面的研究。随着指
对化石能源的不断开采和使用,对生态环境造成了严重的影响,为了更好地保护地球的生态环境,利用绿色能源和可再生能源以实现可持续发展迫在眉睫。太阳能是一种备受人们亲睐的清洁能源,有着广阔的发展前景。光伏发电作为目前开发太阳能的主要方式,具有安全可靠、应用形式灵活、安装维护简单等优势。但是光伏发电存在电能转化率低、成本高等问题,目前广泛使用的最大功率跟踪控制算法(MPPT),是提高其转换效率的重要手段。首
在当前情况下,关于微电网电压和频率控制方面的探索在世界各国正如火如荼地开展着。在以后的发展中,由多个可以提供电能的子微电网组成的大型多微网配电系统的应用将具有很强的竞争力,这对微电网的功率和电压控制提出更高的要求。虽然目前国内外许多学者已进行了一些研究,但对于微电网功率控制方面的研究仍然是一个瓶颈。各种微源在微电网中输入输出功率和电压不稳定,因此提出有效的功率、电压控制方法尤为重要。本论文的内容是
拒绝服务DoS(Denial of Service)攻击是一种典型的网络安全威胁,尤其是其最新发展出的慢速拒绝服务LDoS(Low-rate Denial of Service)攻击采用了全新的攻击方式,更难以被检测与防范
随着数字信息的爆炸式增长,备份系统中的重复数据越来越多,造成了存储资源和网络带宽的极大浪费,同时增加了处理重复数据的开销。数据去重技术旨在减少数据所占的存储空间和通过