论文部分内容阅读
随着网络技术的高速发展,网络的带宽和规模不断增大,网络的用户数量和需求也日益增多。在用户需求的刺激下,涌现出大量的新型网络应用。相比于传统应用,这些应用的功能更加丰富,同时协议结构也更加复杂。这些变化使得网络应用流量结构愈发复杂化,因此迫切需要通过网络应用流量识别技术对网络流量进行有效的管理。在目前的应用识别方法中,深度包检视技术是应用最广泛的,这种技术具有识别准确率高,实时性好的优点。但是这种技术依赖于网络应用特征库的建立,而目前应用特征的提取主要依靠人工提取来完成。面对当前海量的应用数量,低效率的应用特征提取严重限制了该技术的进一步发展。提取应用特征的过程与使用关联规则挖掘技术提取频繁项集的过程极其相似,显然采用关联规则挖掘来进行应用特征的提取是一个可行的方法。因此,本文通过对关联规则挖掘技术的深入学习,结合网络应用识别的技术特点,设计了应用特征自动提取的方法。本文的主要内容包括: (1)分析了应用识别的研究背景及现状,通过比较几种应用识别方法的优缺点,选择了更加符合目前应用识别需求的深度包检视技术作为研究对象。随后对关联规则挖掘技术进行了研究,对Apriori算法进行了重点分析,说明了使用关联规则挖掘进行应用特征提取的可行性。 (2)结合应用特征提取的特点,对频繁项集加入了偏移属性的约束,在Apriori算法的基础上设计了具有固定偏移属性的应用特征提取算法。同时针对算法执行效率较差的情况,对算法的连接策略进行了优化,并加入了新的拆分步骤。实验表明,算法可以提取出识别效果很好的应用特征,并且对算法的改进显著提升了算法的执行效率。 (3)针对一些应用特征偏移属性的不确定性,对算法适用范围进行了扩展,设计了具有动态偏移属性的应用特征提取算法,使得算法能够更广泛的应用于各种网络应用数据的特征提取中,并且基于矩阵的思想对算法的提取效率进行了进一步的优化。实验表明,算法相比于具有固定偏移属性的应用特征提取算法,具有更广泛的应用范围,并且提取得到的应用特征识别准确率也更高。 论文最后对全文进行了总结,并对未来值得进一步研究的问题进行了展望。