论文部分内容阅读
网络流量分类识别是互联网研究领域的重要分支。互联网流量的深入分析研究对于网络扩容和优化、网络安全、上层用户行为分析等具有重要意义。近年来,互联网的持续演进和发展给流量分类识别研究带来新的问题和挑战。一方面,由于应用的复杂性,传统的基于端口和基于载荷的流量分类方法突显出其局限性,迫切需要一种更有效、更准确的流量分类新方法。另一方面,原始的IPv4协议由于其先天不足将被新一代网络层协议IPv6所取代,也给流量分类识别研究带来了新的挑战。针对上述问题,本文主要开展以下研究工作:①结合重庆大学校园网IPv4和IPv6网络流量实际情况,本文完整的介绍了新兴的基于网络流统计特征的机器学习分类方法的分类过程,并提出了目前IPv6网络流量分类中所面临的两大难点问题。②针对IPv6网络流量中应用分布严重不平衡的问题,提出一种多分类器集成学习分类方法。该方法在以往研究者使用单一机器学习算法对网络流量进行分类的基础上,结合不同的单一机器学习算法分类器各自的特点,使用传统的基于多数投票法和一种新的基于实例选择集成方法实现网络流量分类。实验结果表明:多分类器集成分类方法在算法准确率和泛化性能上有所提升。③针对IPv6网络未知流量的识别问题,提出一种改进型DBSCAN聚类流量分析方法。该方法在对基于密度的DBSCAN聚类算法深入分析的基础上,改进了该算法时间效率性上的不足,最后通过改进型DBSCAN算法完成对校园网IPv6网络流量真实数据的聚类分析。实验结果表明:改进型DBSCAN算法聚类效果较好,能有效的发现网络中的未知流量。④最后,本文针对现有的大多数流量分类识别工具只实现了整个分类过程中某一个或几个过程,没有一个较为完整的专业网络流统计特征的机器学习流量分类识别工具的现象,设计并实现了一个基于B/S模式的流量分类识别原型系统,为以后的流量分类识别工作提供一个较好的实验平台。