基于机器学习的网络流量分类技术研究与应用

来源 :安徽理工大学 | 被引量 : 9次 | 上传用户:sunnymurder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的蓬勃发展,种类繁多的互联网应用产生的大量流量占用了很多网络资源,在给服务质量带来巨大挑战的同时也给互联网安全产生负面影响。为了高效地利用网络资源并为网络管理者提供有效的管控手段,以辨别应用层协议为目的的网络流量分类技术成为近年来的研究热点问题。文章以此为研究背景,以具有相同五元组的传输层双向报文序列为研究对象,对基于机器学习的网络流量分类技术进行研究并加以应用。文章首先介绍了基于知名端口号、基于特征字匹配等传统的网络流量分类技术,但因其固有的缺陷导致分类精度已难以满足现阶段的需求,故引出基于机器学习的网络流量分类技术。随后文章对机器学习中的朴素贝叶斯、C4.5决策树、支持向量机以及集成学习分类算法进行了研究。之后,根据上述机器学习算法的特点,文章提出两种改进的分类算法,分别是以样本缩减策略为基础的基于支持向量机的改进算法以及基于结果反馈的机器学习改进算法。第一种改进算法以信息增益率和样本质心为理论基础,将对分类结果影响不大的属性和靠近样本质心的样本点删除,只用可能成为支持向量的样本点进行训练,在保证正确率的同时增加了训练效率;第二种改进算法以分类器的误判样本集合为基础,将误判样本的正确分类结果反馈给测试样本,以增加分类器对测试样本的分类精度。最后,文章对数据包捕获、流形成、流属性确定、流样本标记流程、连续数据离散化进行了描述,并利用经典数据集对基于机器学习的网络流量分类算法及其改进算法进行应用。实验结果表明机器学习分类算法能够避免传统分类算法的缺陷,将不同应用层协议产生的流量高精度地分类。对改进算法的实验结果表明,基于支持向量机的改进算法在保持精度不变的基础上大幅度缩短了训练时间,基于结果反馈的机器学习改进算法成功地利用误判集合将正确结果反馈给待测样本,增加了分类精度。验证了改进算法在训练效率与精度上对原算法的提升。
其他文献
西辽河流域特殊的地理位置,决定了古代的西辽河地区成为连接中国南北和沟通世界东西的交通要冲,具有多种经济成分并存、多种文化因素荟萃的特点,也决定了西辽河地区成为中国古代
2008年以来,国家向基础建设方面投入四万亿元资金,我国的基本建设规模的迅速扩大,使建筑行业得到了前所未有的发展。作为建筑业的主要结构形式——混凝土结构,已经广泛应用于各种
在我国向市场经济转轨的时期,随着市场体系的日益完善,在越来越追求公平、公正、公开竞争秩序的背景下,商业贿赂的危害性越来越清晰的凸现出来。它如同生长在市场经济肌体上
本文通过理论和实证分析相结合的方法,以描述性统计和回归分析为手段,以新三板审计市场为研究主体,以国内具有证券资格的会计师事务所为研究对象,选取了2014年4月5日之前在新
“创意城市”属于文化创意产业理论研究体系中一个新的研究领域。地方认同感作为创意城市的重要构成要素,是构建创意城市的基础。全球化趋势需要城市更具有包容内涵,“包容性
财务管理是中等职业学校最重要的基础管理环节之一,其在新时期面临着新的机遇,大部分的中等职业学校开始由传统的政府附属机构转变为自主办学的法人实体,其资金来源从单一的政府
本文通过特里·巴雷特先生(Terry Barrett)将摄影作品的解读语境分为了“内在语境”、“原始语境”以及“外在语境”的概念对安东·海瑟文克(Anton Hazewinkel)的《360人·物》摄
融商业、科技、艺术等多专业为一体的跨学科教学是跨入新世纪国际艺术设计教育界改进传统设计教育,发展创新设计教育的热点话题和主流趋势。这一发展趋势近年也为我国设计教育
在国内动态图形设计逐渐兴起的当下,动态图形设计实践的发展异军突起,但是国内的从业者们普遍缺乏统一有效的理论指导。因此本文以数字媒体艺术理论为指引,结合电视频道包装领域
现代索道桥是以承重索和锚碇为主要受力构件、以钢横梁和桥面板等作为局部受力构件的一种新型悬索体系桥梁,主要由承重索系统、稳定结构、桥面系、索塔锚碇四大部分组成,具有结