论文部分内容阅读
随着网络规模日益庞大,网络的拓扑结构也随着用户的增加而变得越来越复杂。尤其在专用局域网管理过程中,系统管理员需要在掌握网络运行数据和状态基础上分析处理问题,保证专用网络信息服务质量。网络拥塞是众多网络故障中最为常见的一种。专用网络在解决网络拥塞诊断过程中,传统解决手段主要依靠费时的人工方式进行。这些促使网络拥塞诊断引入新的技术。本文针对专用网络拥塞诊断问题开展研究,通过收集网络数据信息进行关联规则的挖掘,发现数据之间隐藏的关联关系,为网络拥塞诊断提供支持。对大规模专用网络数据采集方法研究并进行数据处理。针对专用网络自身结构复杂、整体网络规模较大、各种网络节点密度高、数据传输变化快和网络流量行为复杂等特点,设计了网络数据混合式采集方法。通过数据采集节点并行部署、混合式采集的方法进行网络数据的采集。对收集到的网络拥塞数据进行数据处理,针对原始数据中出现的数据重复、非结构化、噪声等问题进行处理,通过对数据进行清洗、集成、筛选、转换使数据达到关联规则挖掘的使用要求。建立基于Apriori和基于FP-Growth的网络拥塞数据关联规则挖掘算法模型,提出改进型算法并建立算法模型。对网络拥塞问题进行分析,对网络拥塞进行关联规则挖掘算法定义,建立相关模型。针对基于Apriori的网络拥塞挖掘算法中“剪枝”需要多次扫描频繁项集的问题,通过统计候选项集中包含频繁项集的计数的方式进行“剪枝”优化;针对“剪枝”后确定频繁项集需要多次扫描网络拥塞数据库的缺陷,提出对支持度阈值判断的改进方法减少扫描次数,并构建了改进型算法模型。设计实验并验证了基于Apriori和基于FP-Growth的网络拥塞数据关联规则挖掘算法和改进型网络拥塞挖掘算法的有效性。通过设置不同的支持度阈值和处理不同网络拥塞数据量的控制变量方法,比较算法执行时间,对比算法执行效率和有效性。通过实验结果显示,改进型网络拥塞关联规则挖掘算法在不同支持度处理相同数据量的情况下比基于Apriori的算法挖掘时间减少46.15%-89.42%,比基于FP-Growth的算法时间减少10.64%-48.71%。在相同支持度处理不同数据量的条件下,改进型算法挖掘时间比基于Apriori的算法减少70.00%-80.55%,比基于FP-Growth的算法时间缩短25.00%-44.45%。综合实验结果,改进型网络拥塞挖掘算法有效提升了算法效率。