基于机器学习的网络流量识别方法研究

来源 :河北科技大学 | 被引量 : 3次 | 上传用户:fengaitong1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,网络流量的爆发式增长和网络协议的灵活使用导致网络威胁越来越多。这些威胁都可以通过网络流量识别得到很好的解决。面对日趋复杂的网络环境,能够处理高维数、多类型等现代网络流量的识别方法,越来越受到人们的重视,其中基于机器学习的流量识别算法是近年来各专家学者研究的重点。网络流量识别的过程主要包括特征处理和流量识别两大方面。针对目前特征处理方法中,不能同时去除特征集中的冗余特征和无关特征的问题,提出了一种基于K-L变换和ReliefF特征选择的KL-RF算法。该算法利用K-L变换去除原始特征集中的冗余特征,并采用自适应的方式调整ReliefF算法的特征权重阈值,去除其中的无关特征,获得优质的特征子集,进而降低流量识别的复杂度,减少训练建模的时间,提高运行效率。针对基于机器学习的AdaBoost-SVM算法,在流量识别中存在样本被多次错分造成的权重失衡问题,提出了改进的AdaBoost-SVM算法,该算法通过调整各类样本的误差分布,选择合理的基识别器权重计算方法,防止训练过程中出现样本权重失衡的现象,提高流量识别的准确率。最后采用Andrew W.Moore数据集对KL-RF算法和改进的AdaBoost-SVM算法进行验证,实验结果显示,与原有算法相比,本文提出的算法降低了特征子集的维数,减小了构建识别模型的时间,提高了流量识别的准确率。
其他文献
随着多媒体技术和因特网的飞速发展,多媒体信息的交流达到了前所未有的深度,盗版和篡改现象日益猖獗,数字水印技术应运而生,并受到广泛关注。本文对数字音频零水印技术和建立
随着多媒体和互联网技术的迅速发展,图像信息呈现出爆炸式的增长,如何在海量数据中快速寻找到所需要的数据已成为亟待解决的问题。图像分类技术通过对图像数据进行分析处理,
WindowsNT系统的数据安全一直是应用研究的重点,虽然人们用了很多方法对windows文件系统中的数据进行保护,但是破解的方法也层出不穷。加密是保护文件系统中数据安全的主要方
目前,GSM通信网络已几乎覆盖人类居住地的各个角落,移动台的GSM定位技术也在不断发展,但目前由于已经成熟的GSM定位技术都依赖于GSM服务商的基站信息数据库和GSM通信服务器,
随着航空事业的发展,航空通信越来越受到人们的关注,也将在未来无线移动通信发展中发挥越来越重要的作用。在航空通信中,由于飞行器的快速运动,接收信号受到航空信道的严重的
带有两个摄像头的视觉系统通常被称为双目立体视觉系统。双目立体视觉可以直接模仿人类视觉立体感知过程,是计算机视觉研究的核心课题之一。系统采用不同位置的两台摄像机从
随着移动通信系统的发展,数字信号交换和传输的速率不断提高,时钟信号的频率偏差所产生的影响也越发明显,因此移动通信网络尤其是无线接入网对于时钟同步都有了更高的要求。
射频识别(Radio Frequency Identification, RFID)是一种利用射频信号自动识别目标对象并获取相关信息的技术,识别工作可自动完成无须人工干预,相关设备可工作于各种恶劣环境
60年,弹指一挥间。但正是在这60年间,中国经历一场波澜壮阔的巨大变迁,写就了光辉的历史篇章,造就了令世界瞩目的“东方奇迹”。60年跨越,60年辉煌。旧中国遗留下来的破旧汽
浅层地震折射波法自上世纪30年代提出以来,被广泛应用于工程地质调查中,无论在仪器野外采集、资料处理与解释还是在理论方法的基础研究方面都取得了巨大的进步。同其他地球物理