网络流分类中的特征选择研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:shaoshao137
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展,互联网的规模不断扩大,业务类型不断增加。一方面网络流量急剧增长,造成网络拥塞,导致网络服务质量下降,另一方面,种类繁多的网络应用,越来越占用网络资源,且给网络安全带来巨大威胁。为更好了解网络状况,及时处理网络故障,并对管理和优化网络配置提供依据,网络管理者需对不同网络应用进行及时、准确的分析,对网络行为进行有效的控制。实现这些的前提和基础是对网络流量的正确识别与分类。目前,基于流统计特征的流量分类方法是研究热点,在这种方法中,定义和提取区分不同类型流量的有效特征与选择合适的分类方法是关键。这里的网络特征,既包含数据包特征也包含数据流特征。富含分类信息特征的选取,能提高分类精确度,同时,特征维度的降低,能减少后续分类器建模时间,提高分类速度。本文从人工分析选择特征和特征选择算法选择特征这两个方面展开研究。首先,在Moore特征集的基础上,人工分析选择特征。本文将Moore特征集的特征按性质分为五个组,分组考察特征对网络流分类的贡献,找出关键特征组别,然后再逐步细化,区分出哪些特征对网络流分类具有相对更高的贡献度。为排除后续机器学习方法对分类的影响,实验时,选择多种机器学习方法进行对比。最终细化出一组特征,在所属特征类别中具有相对更好的分类效果。其次,在已有人工分析选择特征的基础上,提出了改进的特征选择方法。特征的人工选择基于经验和大量实验,效率不高且可能无法覆盖到所有富含分类信息的特征,用特征选择算法自动选取特征,可以排除人的干扰,能提高效率和尽可能覆盖好的特征。本文结合已有研究结论与信息增益测度,对传统遗传算法中的几个步骤进行改进,提出了基于信息增益与遗传算法的特征选择方法,用于流量识别。实验对比几种使用相同数据集进实验验证的特征选择方法,本文提出方法在精简特征的同时,能保持较高的分类准确性,可以适用于大规模网络流量的分类。
其他文献
随着实时计算的功能日益强大,应用成本的降低,实时计算技术广泛应用于航空航天、核电能源、工业过程控制、军事指挥控制、火炮自动控制等多任务实时系统.特别由于实时计算技
汉语自动分词是中文信息处理领域中的基础课题,其中,歧义切分的消除是影响分词精度的关键问题。国内外很多学者在自动分词领域展开了富有成效的工作,但在提高分词精度上,仍然存在
学位
随着Internet高速网络中实时和多媒体应用业务的迅速发展,要求通信网络能提供高效的服务质量(QoS)支持,但是传统的“尽力而为”网络机制并不能满足QoS通信的要求。近几年的研究
本文通过作者参与设计、开发的研究生院管理信息系统阐述了面向对象的软件工程及面向对象的软件设计方法——UML在软件开发过程中的应用,论文其次研究了多层分布式系统的应用
数据仓库的目的是为了建立一种体系化的数据存储环境,将分析决策所需的大量数据从原来的环境中分离出来,使分散、不一致的操作数据转换成集成、统一的信息。但是非Agent结构的
本项目针对锦州师专热力管网地理信息系统的现有特点,充分了解其工作性质及流程需求,分析其功能和组织结构,开发出热力管网地理信息系统。本系统是融合计算机图形和数据库于一体
设计模式重用方法的研究是一项十分重要的基础性和创新性的研究。它主要包括新应用需求和设计模式的形式化描述、在模式库中找出一组包含新应用领域的模式的可重用的设计、重
MANET(移动Ad hoc网络)是一种临时的自治无线网络系统,由一组兼有主机和路由器功能的移动节点组成。MANET能够快速建立,无需固定的基础设施,因此已被广泛应用于军事、个人通信、紧
移动数据库技术是分布式数据库技术和分布式计算研究的重要分支,移动数据库通常可以看作是传统分布式数据库的扩展。移动计算环境相对于传统的分布式计算环境具有了新的特点,使