论文部分内容阅读
匿名通信系统由于其具备掩盖通信关系的能力,已经逐步成为网络攻击、黑市交易等网络犯罪行为实施的必备工具,各类匿名通信技术的滥用严重破坏了网络空间的秩序。在匿名通信系统中,Tor以其易部署、强匿名和低延时的特点而被广泛使用。尽管针对Tor的流量检测方法层出不穷,然而随着匿名通信与监管对抗的日益激烈,Tor的对抗流量分析的手段也不断演进。首跳连接作为接入Tor网络的关键环节,其历来是流量分析的工作重点。近年来,为了增强首跳连接的安全性和隐蔽性,Tor引入了obfs4(The obfourscator)网桥机制,其作为当前应用最广泛的混淆网桥插件,通过使用全密文流量形态混淆和随机填充技术将Tor流量伪装为正常加密TCP流量,隐匿了Tor流量的全部明文信息和部分指纹特征。当前针对Tor流量的识别方法研究仍集中在常规Tor流量识别层面,尚缺乏针对obfs4混淆网桥流量的识别研究。此外,基于混淆网桥流量进一步挖掘用户行为信息对于Tor流量的监管也有着重要的价值。针对Tor-obfs4混淆网桥流量,本文对其精细化识别工作开展研究:(1)分析了Tor-obfs4混淆网桥流量各阶段通信模式及交互行为特性。基于Tor匿名通信网络及其网桥的工作机理,从内置节点obfs4握手、数据传输和申请网桥节点三个阶段分析了Tor-obfs4混淆网桥流量的通信模式和交互行为特点,对Tor-obfs4混淆网桥流量的典型特性分析可以为后续精细化识别技术的研究奠定基础。(2)提出了基于多维多粒度特征集成学习的Tor-obfs4网桥流量识别方案。为了实现Tor-obfs4混淆网桥流量的高效高精准检测,利用Tor-obfs4数据流的随机性特征、数据包长度特征和上下行交互序列特征实现对背景干扰流量的快速过滤,并进一步建立多维特征库,采用基于卡方检验和极限随机树的特征筛选方法,形成可有效识别Tor-obfs4流量的特征集合,利用集成学习方法实现Tor-obfs4网桥流量的检测。(3)提出了基于卷积神经网络驱动K近邻的Tor-obfs4混淆网桥页面识别方案。为了对网桥流量中承载的访问页面行为进行识别,提取Tor-obfs4页面流量特征集,利用卷积神经网络学习Tor-obfs4访问页面流量的全局交互特征以及各维度局部通信特征,并将其与网页流量的特征结合利用K近邻算法来实现网桥中页面访问行为的识别。(4)设计了Tor混淆网桥流量精细化识别原型系统。从系统框架、模块设计等方面阐述了该系统的工作机理,验证了所提出的Tor-obfs4流量识别及页面访问流量识别方法的有效性,实验结果显示该系统能较为精准地识别Tor-obfs4网桥流量,且初步具备对其承载的网页访问流量所归属的页面进行识别的能力。论文最后对全文进行了总结,并对Tor混淆网桥流量精细化识别技术未来的研究方向进行了展望。