基于Shadowsocks的流量识别研究

来源 :中国人民公安大学 | 被引量 : 3次 | 上传用户:ly6624
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Shadowsocks作为一款新兴的匿名通信工具,因为其出色的通信效率以及其稳定性,逐渐在国内流行。目前国内对于Shadowsocks的研究较少,且对于Shadowsocks运行机制的系统性研究较少,本文分别对Shadowsocks的流量识别开展了以下研究:1、经过对大量Shadowsocks的流量样本数据进行分析研究后,本文对Shadowsocks的运行机制与通信原理进行了系统的描述与总结。2、针对传统流量统计特征集中可能存在高相似依赖性冗余特征,从而导致识别过程中大幅降低分类器性能的问题,本文提出了一种基于主成分分析-皮尔森相关系数的特征提取模型,该模型能对目前已有的传统流量统计特征进行降维,去除与样本相关性较低的特征,最终筛选出相关性强,冗余度低的适用于识别Shadowsocks流量的特征集。同时使用了随机森林、支持向量机(Support Vector Machine,SVM)和极端梯度提升(eXtreme Gradient Boosting,XGBoost)三种算法对该特征集进行建模识别验证,实验结果证明该特征集能在保证识别准确率不大幅度降低的情况下大大提升识别效率。3、针对分类器在Shadowsocks流量占比小的不均衡样本集上识别率低下的问题,本文提出了基于网络流多重过滤的识别模型。经过对大量Shadowsocks流量样本进行分析,根据提取出的字符分布特征,提出了基于字符熵的过滤方法;根据提取出的报文长度序列特征,提出了基于报文长度序列的过滤方法;根据上两步过滤的结果,提出了基于数据包长度熵的过滤方法。最终融合了三个过滤步骤来对混合流进行多重过滤,并结合经过降维后的特征集以及XGBoost算法构建了分类模型。最终实验结果证明,通过对混合流中的Shadowsocks流量与非Shadowsocks流量进行提前筛选过滤,有效的提高了面对不均衡样本集时识别的准确率,同时大大提升了识别的效率。
其他文献
猪丹毒是猪的一种常见传染病,急性猪丹毒一般突然发病,主要表现为败血症、高热以及皮肤出现形状不一且大小不等的紫色疹块,俗称“打火印”。猪丹毒不仅严重危害养猪业,还是一
随着人们对均衡膳食和高品质面制品需求的不断提高,通过添加大豆膳食纤维改良面团流变学特性,进而在一定程度上改良面制品品质成为新的研究热点。该文综述了近年来添加大豆膳
社会资本是一个多维度的概念,能有效降低民间借贷风险,是我国民间借贷规制中不可忽视的因素。本文基于2013年中国家庭金融调查数据(CHFS),运用条件混合过程(CMP)方法改进的Or
贫燃预混燃烧作为一种非常具有发展前景的新型燃烧技术,在提高燃烧效率、降低污染排放方面发挥着重要的作用,它被越来越多地应用到实际的工业燃烧当中。然而,贫燃预混燃烧也
中国特色社会主义社会建设,是中国特色社会主义事业总体布局的重要组成部分。以胡锦涛为总书记的党中央集党对社会主义社会建设全部认识之大成,创造性地提出构建社会主义和谐社
传统抽油烟机具有诸多缺点,并且有很多缺点当前难以有效解决。为此在文中对传统抽油烟机的缺点进行了分析,在此基础上提出了一种新的设计以改善传统抽油烟机的缺点。
小菜蛾(Plutella xylostella L.),属鳞翅目菜蛾科,是一种在世界各地均有分布的主要危害十字花科蔬菜的害虫。由于小菜蛾的危害极大,因此用于治理小菜蛾的费用也是十分的高昂,经统计,全世界每年用于防治小菜蛾的费用高达40-50亿美元。小菜蛾幼虫主要取食十字花科蔬菜的叶片,严重时全叶被取食成网状。小菜蛾本身具有世代短、发生量大、抗药性发展快且较为严重等特点,因此对防治小菜蛾的过程中造成
互联网的普及和快速发展,给人们的社会生活带来了巨大的变革。面对突如其来的网络世界,当代大学生表现出了极大的好奇和热情。然而,大学生在使用网络的同时,也遭受了由于过度
氨是一种重要的化工原料,在过去的一个世纪里以氨为原料制造的化学氮肥提高了全球农作物产量,解决了数十亿人的粮食供应问题。目前,工业合成氨工艺主要为Haber-Bosch法,但是
跌倒是指人体的任何部位失去平衡而意外地触及地面或其他低于平面的物体。老年人跌倒是指意识清楚的老年人非故意性地跌倒在地上。随着社会老龄化,住院患者发生意外跌倒的概率