论文部分内容阅读
网络应用的飞速发展增加了网络服务质量的重要性,作为网络管理的基础,网络流量识别技术持续发展,最新的基于协议隐马尔可夫模型的识别技术综合考虑了网络流的时序特征和统计特征,有很好的识别准确率,但是已有研究是人工构建协议隐马尔可夫模型的,这无法满足实际应用的需求。因此,本文提出一种自动构建协议隐马尔可夫模型的方法,通过实验验证了自动建模方法的正确性,并在校园网中基于自动构建的协议隐马尔可夫模型进行了流量识别的应用,结果进一步论证了本文自动建模方法的理论意义和应用价值。本文从原理、算法和应用三方面主要做了如下工作:1.提出自动构建网络协议隐马尔可夫模型的方法,并对方法的正确性进行了实验验证。通过研究网络流的时序特征和统计特征,提出自动建模的方法:用基于密度的聚类算法对网络流数据包进行聚类分析,来获取与协议隐马尔可夫模型初始结构相对应的有穷状态机,以体现网络流的时序特征,并抽象出数据包的特征向量,用有穷状态机中“状态”间的转移概率和“状态”下特征向量的条件分布表征网络流的统计特征;然后通过有穷状态机的先验指导对模型参数进行训练,从而获得完整的协议隐马尔可夫模型。同时选取六种典型的网络应用进行实验,将自动构建的协议隐马尔可夫模型和人工构建的模型进行对比,初步证明了本文自动建模方法的正确性。2.改进了基于密度的DBSCAN聚类算法,并通过实验验证了算法的性能。本文通过分析DBSCAN算法的聚类原理,从减少区域查询次数和查询时间方面对算法进行了改进,并将其用于自动建模过程中的聚类分析;实验证明改进的算法比原算法有更高的聚类效率。3.在校园网环境中对自动建模的方法进行了流量识别的应用。基于自动构建的协议隐马尔可夫模型进行了网络流量分类的应用测试,通过与基于人工构建的协议隐马尔可夫模型和Weka平台上三种典型流量识别方法(朴素贝叶斯方法、神经网络方法和支持向量机方法)的分类结果进行对比,进一步验证了本文提出的自动建模方法的应用价值。