类别不平衡条件下的小样本加密流量识别

被引量 : 0次 | 上传用户:allen75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着应用类型的多样化发展,互联网逐渐成为日常生活中不可或缺的交流平台。人们在享受互联网海量信息带来的便利的同时,也意识到安全与隐私的重要性。加密技术的应用使得网络控管的难度增加,所以从海量数据中识别加密流量是十分重要的。现实网络环境中的加密流量比例很小,传统的识别方法容易造成错误分类,进而对于加密流量的识别度很低。本文针对网络流量的不平衡环境中,加密流量的识别开展研究。本文首先对类别不平衡问题进行了相关研究,分析了数据集本身对分类的影响,并对传统分类器性能的评价准则进行讨论。对机器学习方法在流量识别上的应用进行了总结,并从中选取两种方法用于处理类别不平衡数据集。研究了过抽样技术,分析了以互信息为度量准则的可实施性,并根据Neyman-Pearson准则对分类器进行性能优化。然后,通过对加密流量的识别和类别不平衡的处理的分析,本文设计并实现了一个静态检测分类系统,达到在一定程度上控制误报率的同时,提高对小样本加密流量的识别。采用过抽样方法对不平衡数据进行预处理。设计了基于互信息最大化的聚类方法,从而实现对于K-Means算法聚类簇数目设定的优化。采用风险函数和代价敏感方法,优化分类器识别小样本的准确率,并构造一个多类别二元分类器序列,实现错误分类的样本数最少,从而提高分类器对小样本的识别。此外,分类器序列能够识别未知应用类型。最后,采用公开数据集对系统模型进行测试,分别对聚类模型和簇内分类模型进行研究,并分析了影响性能的因素。实验结果显示,系统对Skype流量的识别率有显著提高,有较好的实用性。
其他文献
食源性疾病是当今世界最为关心的问题之一。沙门氏菌是重要的食源性致病菌之一。由沙门氏菌导致的食品中毒和禽蛋肉类的污染对人类的健康造成了危害。近年来,随着酶联免疫和P
目的了解本地区尿路感染中产ESBL大肠埃希菌检出率和细菌产生耐药的原因,分析耐药菌株对尿路感染患者抗菌治疗的影响。方法对2007—2009 3年来尿路感染患者中段尿分离大肠埃
老子美学思想是及其丰富的。其中,重身、贵身思想是其美学的旨归。老子对玄之又玄的"道"的界定,意在消解宗教神性对人的束缚,旨在人的自由与和谐;老子对人的生存和生命的关注
针对集装箱船航行过程中舱口盖定位销承受巨大载荷,需要设置支撑结构,强度需要仔细校核的问题,对现有集装箱船典型横舱壁定位销支撑结构进行有限元计算,推导出板厚的经验公式
本文通过分析山西省运城地区的果树生产现状,存在的问题,综合运用农业技术推广理论,区域发展规划等理论和方法,根据动态性原则,区域性原则和科学原则,从可持续发展,产业化的
NAT技术是IPv4网络中最受欢迎的技术之一,因为它不仅解决了IP地址不够用足的问题,还带来了其他特性,如隐藏内部网络、更换出口运营商容易等,使得通过长期使用,很多人非常喜欢
利用全排列多边形图示指标法构建评价模型,从资源能源消耗、污染物排放、综合利用、环保治理及无害化等方面构建节能减排评价指标体系,并对福建省2001—2010年节能减排进行绩
概括毛衫中常用的组织结构,具体分析凹凸花纹效果组织、镂空效果组织、花色图案效果组织、卷边效果组织和波纹效果组织的表现手法,并以实例说明它们在毛衫设计中的表现风格。