基于Apriori算法的网络应用流量识别特征提取方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:dsgver454g
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的高速发展,网络的带宽和规模不断增大,网络的用户数量和需求也日益增多。在用户需求的刺激下,涌现出大量的新型网络应用。相比于传统应用,这些应用的功能更加丰富,同时协议结构也更加复杂。这些变化使得网络应用流量结构愈发复杂化,因此迫切需要通过网络应用流量识别技术对网络流量进行有效的管理。在目前的应用识别方法中,深度包检视技术是应用最广泛的,这种技术具有识别准确率高,实时性好的优点。但是这种技术依赖于网络应用特征库的建立,而目前应用特征的提取主要依靠人工提取来完成。面对当前海量的应用数量,低效率的应用特征提取严重限制了该技术的进一步发展。提取应用特征的过程与使用关联规则挖掘技术提取频繁项集的过程极其相似,显然采用关联规则挖掘来进行应用特征的提取是一个可行的方法。因此,本文通过对关联规则挖掘技术的深入学习,结合网络应用识别的技术特点,设计了应用特征自动提取的方法。本文的主要内容包括:  (1)分析了应用识别的研究背景及现状,通过比较几种应用识别方法的优缺点,选择了更加符合目前应用识别需求的深度包检视技术作为研究对象。随后对关联规则挖掘技术进行了研究,对Apriori算法进行了重点分析,说明了使用关联规则挖掘进行应用特征提取的可行性。  (2)结合应用特征提取的特点,对频繁项集加入了偏移属性的约束,在Apriori算法的基础上设计了具有固定偏移属性的应用特征提取算法。同时针对算法执行效率较差的情况,对算法的连接策略进行了优化,并加入了新的拆分步骤。实验表明,算法可以提取出识别效果很好的应用特征,并且对算法的改进显著提升了算法的执行效率。  (3)针对一些应用特征偏移属性的不确定性,对算法适用范围进行了扩展,设计了具有动态偏移属性的应用特征提取算法,使得算法能够更广泛的应用于各种网络应用数据的特征提取中,并且基于矩阵的思想对算法的提取效率进行了进一步的优化。实验表明,算法相比于具有固定偏移属性的应用特征提取算法,具有更广泛的应用范围,并且提取得到的应用特征识别准确率也更高。  论文最后对全文进行了总结,并对未来值得进一步研究的问题进行了展望。
其他文献
本文以多种类型的音频信号为实验研究对象,研究工作重点放在盲分离算法在音频检测中的应用方面:(1)讨论了盲分离算法对音频信号预处理的过程,并设计对男女混合语音进行预白化
该文在广泛查阅国内外纸币号码识别方面资料的基础上,通过仔细分析和研究纸币清分机的实现原理和核心技术,初步实现了一个基于DSP的纸币号码的自动输入和识别系统.该系统接收
学位
模糊神经网络是模糊逻辑推理与神经网络有机结合的产物,是智能复合控制发展的必然趋势.它的学习算法是其理论与应用研究中最关键的一个方面.由于结构学习通常可以转化为参数
随着微电子技术和微计算机系统的发展与应用,微型无人机的研究与发展引起了国内外研究人员的普遍关注,其中微型四旋翼无人机由于其不可替代的优点备受关注。在微型四旋翼无人机
自适应控制分为线性系统的自适应控制和非线性系统的自适应控制两部分,线性系统的自适应控制理论已经发展得比较成熟,而非线性系统的自适应控制还未有一套成熟通用的理论。论文
声波是目前已知的水下通信最佳载体。当前流行的单载波、多载波、扩频以及脉位调制水声通信体制由于采用固定载波的调制方式,在通信对抗中容易被敌手发现。借鉴伪装的思想,为提
灵武长枣作为宁夏灵武市的主要栽植品种,是目前宁夏枣类的主导品种,枣果行业的不断发展带动了以灵武长枣为原材料的相关产业的发展。目前灵武长枣成熟度分级主要依靠人工完成
本文以在自主开发的网络行为建模环境下所采集的流量信号为研究对象,通过借鉴多个学科领域的研究思路与手段,对网络流量数据,特别是突发性流量数据的动力学特性进行了系统深
针对数据挖掘聚类算法,本文着重讨论研究了两种数据聚类算法:基于粒子群优化的自组织特征映射神经网络聚类算法(PSOSOM)和基于遗传算法的模糊C-均值聚类算法(GAFCM).本文采用