基于机器学习的加密流量识别算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yujing4953
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,网络中充斥的各种各样的加密流量,而为了有效识别各类应用的加密流量,以提高网络管理、改善网络服务、保障网络环境安全,加密流量的特征提取和应用识别显得越来越重要。本文在机器学习算法的基础上,就加密流量识别算法进行研究,本文的主要工作如下:1)本文首先分析总结了传统流量识别方法,对比了各个方法的优缺点以及适用场景,并进一步分析了传统方法在当前加密流量爆发式增长的网络环境下面临的困境。然后分析了机器学习方法相比于传统流量识别方法的优势所在。2)本文基于Bagging提出了一种面向应用的加密流量识别算法,借助数据流统计特征对加密流量对应的应用类型进行分类,并利用孤立森林对特征数据集中的噪声样本进行去除,以进一步提高算法的准确率。在该算法的基础上,对应用进一步细化分类,尝试对应用的功能模块的进行识别,并提出了一种面向功能的加密流量识别算法。在功能识别中,由于数据流统计特征难以覆盖所有功能,本文引入了负载特征作为辅助,并有效提高了算法的识别准确率。最后通过实验测试了两个算法分别在应用识别和功能识别的识别效果,均取得较高的准确率、精确率、召回率。3)本文在上述两个算法的基础上,为提高Bagging算法对大规模数据集的适应性以及算法的运行效率,提出了一种基于Spark的并行优化方法,并从数据优化和任务优化两个层面分别提出了相应的并行优化策略。实验显示,这种基于Spark的并行优化的方法有效提高了Bagging算法在处理大规模数据集时的识别效率,同时也使得Bagging算法的准确率更为稳定。
其他文献
削铅笔折芯是个人人都经历过,并习以为常的事,可是,有一位叫马文臣的物理老师,竞从削铅笔的不满中,异想天开闯出一个新产业……马文臣曾是一个很普通的物理老师,每天给学生上
随着全球范围内流行性疾病的传播,抗菌材料的研究受到人们的重视。抗菌材料中只有结构型抗菌聚合物抗菌分子不会扩散,不会耗尽,抗菌功能持久且很大程度上不会产生耐药性。水性丙烯酸树脂具有许多优异的特性,广泛应用于家居、医疗领域的表面涂装,合成结构型抗菌水性丙烯酸树脂具有重要的意义。本文以甲基丙烯酸甲酯(MMA)、丙烯酸丁酯(BA)、丙烯酸羟丙酯(HPA)、丙烯酸(AA)为单体,过氧化二苯甲酰(BPO)为引
目的探讨心律失常型癫痫临床特征.方法对5例心律失常型癫痫临床表现及脑电图改变进行分析.结果本组患者的主要临床表现为反复发作性室上性心动过速及心绞痛样发作,历时1~3 min
目的探讨胰多肽免疫反应细胞(PP-IR细胞)在人胎小肠中的个体发生及分布.方法用免疫组织化学PAP法观察24例11~27周人胎小肠内PP-IR细胞的形态及定位.结果胎期小肠的PP-IR细胞主
南里海盆地位于中亚—里海地区,为一山间盆地。本论文应用含油气盆地分析、石油地质学等理论指导研究,以含油气系统分析为突破口,对南里海盆地的盆地基础地质特征、石油地质特征及油气分布特征进行研究,划分盆地含油气系统并探寻油气的富集因素,在对盆地储层特征进行研究总结的基础上,表征油气成藏组合,进而对南里海盆地进行资源潜力评价并预测油气勘探有利区带。南里海盆地发育两个含油气系统:迈科普群(渐新统—下中新统)
目的应用错配聚合酶链反应-限制性片断长度多态性(PCR-RFLP)方法进行脊肌萎缩症(spinal muscular atrophy,SMA)的产前诊断.方法基于运动神经元生存基因(SMN)的两个同源拷贝碱
1 迈开一步天地宽 孝感市农机推广站改革起步于1989年,当时地方财政拨款虽未造成人头工资缺口,但科技推广经费和办公经费奇缺。为了解决经费不足的矛盾,在我站内部展开了一
背景:地衣芽孢杆菌活菌制剂是一种微生态活菌制剂,具有提升人体免疫力和预防疾病等作用,近年在临床治疗中逐渐广泛应用。微生态制剂产品的质量控制关键在于对该制品的安全性和有效性的评价。芽孢数作为芽孢杆菌性能的重要指标,只有芽孢数较高时才能发挥较好的益生效果。传统检测地衣芽孢杆菌活菌制剂芽孢数的方法操作繁琐,检测周期长,严重滞后于生产过程。目的:通过探索芽孢特异性物质2,6-吡啶二羧酸(DPA)的提取方法
随着科技的发展,网络时代迅速崛起,越来越多的事务随着网络的建立产生联系。例如脑部疾病的研究结果从最初的影像学唯一论转变为对影像学报告和脑网络评价指标的共同分析。随