基于数据流挖掘的网络流量识别研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:liteary
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网快速发展,网络应用类型不断丰富,网络流量呈现爆发式增长。大量P2P业务产生的流量占据网络带宽,造成网络拥堵,使得网络服务质量不断下降。为了有效监管网络,需要对网络流量进行实时识别,根据不同的应用类型提供差异化服务,保证网络安全,优化网络资源。然而,面对海量、不断到来的网络流量,传统的机器学习方法和集中式处理平台已经无法满足要求。结合数据流挖掘的网络流量识别方法与大数据流式处理平台Spark Streaming,提出了在线网络流量识别方案。在线网络流量识别的关键在网络流特征的选择和数据流挖掘方法两个方面,本文结合网络流量的特点提出了一种有效的网络流特征选择方法;分别研究数据流分类和聚类算法以进行网络流量的识别,对比分析了各自的特点和主要应用场景。本文主要工作包括以下几个方面:(1)对网络流特征进行特征选择由于网络流特征复杂,属性维度高,无法直接用于在线网络流量识别。提出一种结合ReliefF和CFS方法的基于投票策略的组合特征选择方法,该方法能够快速高效去除无关、冗余特征,最终选择出一组适合在线识别的网络流特征。(2)改进数据流分类算法,并将其应用于网络流量识别分类算法具有较高的分类准确率和速度。分析数据流分类算法进行网络流量识别存在的问题。在CVFDT的基础上进行改进,改进后的算法AG_CVFDT有效解决了网络流量概念漂移和偏态分布问题,同时将算法在Spark Streaming上并行化实现,提高了网络流量识别效率。(3)研究有效的数据流聚类算法及相应的网络流量识别方案聚类算法能发现网络中新出现的应用类型。分析数据流聚类算法CluStream和D-Stream进行网络流量识别的优缺点,结合两者的优点设计具有双层结构的数据流聚类算法GDDSC,并给出了相应的网络流量识别方案。该方法支持演化分析,能得到任意形状聚类簇,同时引入趋度判断,提高了识别准确性。
其他文献
党的十九大吹响了建设教育强国的号角,国家职业教育专业教学资源库建设为高等职业教育改革注入了强大动力,对职业院校的教育有重要的影响。教学资源库在推广应用过程中,存在
当前台湾大选已进入倒计时,各政治势力围绕选举展开异常激烈的竞争。而在郭台铭和柯文哲宣布不参与联署登记后,选战主轴重新回到传统的蓝绿对抗态势之中。蔡英文在近期的岛内
文章运用语料库技术的方法,以定量与定性相结合的形式,穷尽性地分析了10000条共计50万字的“见”字语料,得出“见”字在现代汉语中的义项分布情况,认为《现汉》对视觉动词“
<正>苏东坡弟子,苏门四学士之一的晁补之曾言:始余幼时读《太平广记》,见唐太宗遣萧翼购兰亭叙事。盖谲以出之。辄叹息曰:《兰亭叙》若是贵耶,至使万乘之主捐信于匹夫,传称子
近年来,随着计算机集群计算能力的大幅度提升,人工智能算法研究和产业落地步入了发展快车道,而聊天机器人作为人工智能重要分支——自然语言处理的一个重要应用,也逐渐成为学术界、工业界重点投入的研究热点和产品方向。聊天机器人技术栈中的多轮回复生成技术具有趣味性、多样性、鲁棒性等多方面的优势,同时也兼具数据、算法、调优等方面的挑战。本次设计主要围绕着聊天机器人中多轮对话回复生成的相关技术展开,人类在闲聊过程
我国于2013年12月对《公司法》进行了修改,并于2014年3月1日正式实施,此后,投资者创立公司没有了注册资本最低限额的规定,改实缴制为认缴制,并废除了强制验资程序。与旧《公司法》
【正】 作为传承文化的民间习俗,特别是那些长年相因流传下来的古老习俗,我们往往只能得知其现象,至于其由来,其所以然,要溯源古代, 探其原貌,是比较难的.《中华全国风俗志》
<木兰诗>是我国古典诗歌中一篇脍炙人口的杰作.古往今来,人们对这首诗推崇备至.明代胡应麟<诗薮>说:"五言之赡,极于焦仲卿妻;杂言之赡,极于木兰."游国恩主编的<中国文学史>称
基于单片机教学视角,分析应用人才培养的相关问题,既是高职单片机课程教学研究的深入发展,也是应用型人才培养途径研究的横向拓展.因此,本文在详细解析“应用型人才”内涵的