未知协议感知的网络流量分类方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:chenyanchendan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络流量分类是指按照一定的规则识别应用层的网络协议。由于传统的端口和特征匹配的方法的效率和准确率都不够理想,很多学者将机器学习应用到网络流量分类领域,基于统计的网络分类方法通过提取一系列网络包级别以及网络流级别的统计参数,并将其作为分类算法的训练数据来得到能够区分不同网络协议的分类器。过往的研究假定训练数据中包含了所有的网络协议的网络数据,而现实情况是新型的协议不停的出现,如果忽略这些协议的网络数据流则会影响精度。本文提出的未知协议感知(upa)的网络流量分类算法着重解决如何分类新型的未知协议的网络流。本文的主要工作有:1.在未知协议网络流数据的提取方法上,本文基于K-Means提出了受限K-Means聚类方法,K-Means是基于训练样本空间距离的聚类方法,而对于网络流数据的分类,本文采用IP地址和端口号进行辅助聚类,从而更加准确的分类不同类别的网络流数据。2.在网络流的分类策略上,本文采用二元分类器与多元分类器相结合的方法提高分类的准确度,对于每一种类别的网络协议,本文都为其训练一个二元分类器,当某条测试数据被多个二元分类器识别时,再使用多元分类器进行判断。实验表明,upa取得了73%的分类准确度,而以往学者提出的半监督分类方法(semi)和一元支持向量机(osvm)分类方法在处理不包含未知协议数据时取得的总分类准确度分别为96%、97%,当需要处理包含未知协议的数据时取得的总分类准确度分别是38%和25%。
其他文献
针对互联网个人影像产品制作过程中,传统手工操作复杂、耗时、并造成网络与服务器高负荷运转的问题,探讨了一种基于等级变异与图像内容特征信息的免疫克隆算法。并以比较复杂
三峡库区河段地质情况复杂,桥梁众多,常常发生船桥相撞事故,对航运安全形成威胁。为此论文提出对三峡库区航运安全进行虚拟现实仿真系统及相关技术的研究,以三峡库区重点航段
共指消解是自然语言处理中的核心任务,它对于篇章分析、自动文摘、信息抽取、信息检索、信息过滤和机器翻译等都具有重要的意义。本文采用基于实例的动态泛化机制,在中英文上
随着信息技术和网络技术的发展,互联网上的信息和资源出现了爆炸性的增长。为了提高用户的有效信息获取能力,个性化推荐系统将会发挥越来越重要的作用。传统的协同过滤推荐技
近年来,计算机和互联网技术的迅速发展越来越显著地改变着人们的生活,多媒体就是借助这两项技术而诞生的应用领域。因此,保护多媒体信息的安全成为人们日益关注的问题。加密
随着无纸化办公成为当前的发展趋势,电子文档得到了广泛应用。各级政府及军事科研机构等部门大量涉密信息都以电子文档的形式存在。电子文档的安全问题便成为一个亟待解决的
虹膜识别是新兴的生物识别技术之一,受到了信息安全领域研究者的广泛关注。与其他生物特征识别技术相比,虹膜识别具唯一性、稳定性、防伪性、非侵入性等特点,使得虹膜识别技
随着网络在全球的普及,Internet已经深入到人类社会的方方面面,随之而来的,与Internet相关的安全事件愈来愈多,对人类生产与生活的影响也日益严重。尤其是蠕虫、僵尸网络以及DDOS
近年来,随着交互式问答应用的兴起,越来越多的人关注人机交互式的信息获取形式,大部分的自动问答系统都是基于FAQ的形式,而没有对问题本身进行理解,本文面向对用户问题的理解,针对
Petri网的可达性是Petri网的重要性质,其判定问题在Petri网理论中是一个重要课题。本文对Petri网的可达标识集做了一些分析,主要内容包括以下几个方面:1)提出了Petri网的表征