【摘 要】
:
通信网络的蓬勃发展和互联网应用的与日俱增带来了大量的网络数据,如何从中挖掘出有价值的特征信息对网络环境进行有效监管成为目前的研究热点,其中对网络流量进行预测和识别具有广阔的发展前景。随着数据挖掘技术的不断发展,在多个领域的数据处理中得到广泛地应用,其中神经网络和集成学习在处理复杂的网络数据中具有一定的优势。本文采用数据挖掘技术进行网络流量预测和业务识别,主要的研究内容包括:针对网络流量的变化趋势具
论文部分内容阅读
通信网络的蓬勃发展和互联网应用的与日俱增带来了大量的网络数据,如何从中挖掘出有价值的特征信息对网络环境进行有效监管成为目前的研究热点,其中对网络流量进行预测和识别具有广阔的发展前景。随着数据挖掘技术的不断发展,在多个领域的数据处理中得到广泛地应用,其中神经网络和集成学习在处理复杂的网络数据中具有一定的优势。本文采用数据挖掘技术进行网络流量预测和业务识别,主要的研究内容包括:针对网络流量的变化趋势具有特征依赖性和实时突变性,而传统网络流量预测模型存在泛化能力弱,无法实时地进行高效预测等问题,本文首先研究了一种并行的二维长短期记忆神经网络预测算法P-LSTM,通过小时和日期两个时间维度挖掘长期特性,采用小时间尺度的数据提取短期特性,然后进行特征融合对网络流量进行预测。为了提高算法的收敛速率,利用改进的粒子滤波算法优化神经网络的参数训练过程,逐次迭代使预测模型快速收敛于稳定的误差,形成最终的预测模型PF-LSTM。从预测精度和训练速率两方面评价模型的性能,实验结果表明,PF-LSTM的平均相对误差相比于传统的LSTM算法降低了8%,同时具有更高的收敛速率。针对网络流量微观特征维数繁多和属性复杂,传统的业务识别方法存在无法适应高维数据的问题,本文研究了一种结合集成学习的网络流量业务识别方法。通过融合邻域判别指数的混合式特征选择算法NDI-RF对网络流量的微观特征进行降维,在特征过滤阶段,考虑特征之间的相互作用,利用邻域判别指数作为判决指标,通过图论聚类思想去除冗余特征,在随机森林封装器上进行特征分配,结合序列后项搜索策略评估各个特征子集的分类效果,逐次迭代选择分类性能较好的特征组成最优特征子集。采用集成学习策略XGBoost训练分类模型,对网络流量进行业务识别。实验结果表明,特征选择算法NDI-RF能够有效地减少最优特征子集的大小,同时通过集成学习取得了较高的识别准确率。
其他文献
真空过滤机无极控制装置是与真空过滤机、气水分离器配套使用的辅助设备,能自动控制滤液的流入或排放,避免了真空泵抽出大量黑水,污染环境,具有工作稳定、安装使用方便、维修最小
目的:总结高血压脑出血术后病人的护理方法。方法:回顾性分析50例高血压脑出血术后病人的病情观察、用药期间护理、并发症预防及护理、康复护理等。结果:50例病人中治愈38例,
新闻价值理论认为,新闻报道能否被受众注意和重视,新闻事实与受众是否接近是一个关键因素.所谓接近性,是指新闻事实在地理或心理等方面与接受者的关联程度,其关联程度愈高,读
随着移动互联网、智能终端在日常生活中的逐渐普及,人们对高速率、高质量的数据传输需求日益加大,卫星通信作为构建全球无缝网络的重要一环,需要具备数据高速率传输的能力。
低低温烟气处理技术工艺的原理是在锅炉空预器后设置MGGH(热媒水热量回收系统),使进入除尘器入口的烟气温度由原来的130℃~150℃降低至90℃(日本称为低低温状态)左右,从而提
植物对昆虫产卵刺激产生的防御反应不仅可以直接抑制卵的发育,还可以为防御下一步若虫/幼虫带来的危害做准备。对褐飞虱产卵处理后水稻植株内一氧化氮(NO)合成的关键酶-硝酸还
“名校”、“名企”出身有助于提高创业者获得风险投资的可能性吗?基于地位信号理论,本文认为,在信息不对称和信息不完全的条件下,通过质量认证和背书、信息和资源收益、地位
为确定表没食子儿茶素没食子酸酯(EGCG)对人支气管上皮Beas-2B细胞的抗氧化作用,本实验采用500μmol/L硫酸镍诱导建立细胞氧化损伤模型,通过测定细胞存活率、ROS生成量、谷胱
在认知语言学的基础上,运用构式语法理论分析了近期网络上大量使用的流行语"被XX"的结构特点。通过转喻映射理论剖析了"被XX"结构的扩展机制及构式意义。
刑法意义上的涵摄是将生活事实涵盖于法律所描述的构成要件的过程,也是三段论中大前提与小前提互动的过程。刑法上的涵摄错误则是指行为人对自己所故意实施的行为事实并未发