论文部分内容阅读
Tor匿名通信网络是目前最成熟、应用最为广泛的匿名通信技术实例之一,其建立在Internet之上综合利用数据转发、信息加密、流量混淆等多种技术来隐藏实体间的通信关系和通信内容,是保密信息传输和隐私保护的重要工具。受限于Tor中继节点的性能、路由选择算法等多种因素的影响,Tor网络通信性能与传统网络通信相比仍差强人意。高速、稳定的匿名通信是用户最关心的问题之一,因此研究Tor通信性能提升手段和方法,对于提高匿名通信的可用性具有重要的研究意义。本文以Tor多种中继文件与测量得到的Tor链路通联关系为基础,分析并建立了与Tor链路性能高度相关的特征体系,从而分别建立起以回归与分类为基本设计原理的Tor链路性能估计框架,通过框架装载机器学习算法进行训练,得到对任意三跳中继节点组成的匿名链路性能进行估计的回归器/分类器,识别出高性能匿名链路用于匿名通信,实现Tor网络的性能优化。本文主要研究工作概括如下:1.提出基于回归的Tor链路性能估计方法,通过分析中继文件与Tor链路通联关系选取多种重要特征,分别设计对比实验进行了有效性验证。然后提出了基于回归的Tor链路性能估计框架,使用多种指标度量了所生成回归器的估计能力。最后使用回归器筛选出预估性能位于前20%的匿名链路作为优化组,同样数量的随机匿名链路作为对照组,实际结果表明优化前后的平均网络时延降低26.29%,时延方差降低了10.2%,证明采用本章所提估计方法能够有效提升Tor通信性能。2.提出基于分类的Tor链路性能估计方法,对原有特征体系的多种特征进行了理论分析,分别设计对比实验验证在分类情况下的有效性,并补充多种适合二分类的特征。然后提出了基于分类的Tor链路性能估计框架,使用多种指标度量了所生成分类器的估计能力。最后使用分类器对若干Tor链路按照性能优劣进行分类,被判别为优秀的匿名链路作为优化组,同样数量的随机匿名链路作为对照组,进行实际网络测量后的实验结果表明,优化前后的平均网络时延降低了48.5%,时延方差降低了41.2%,证明了本章所提估计方法被用于Tor通信性能提升的有效性。3.设计搭建了Tor链路性能估计系统,先按照两种估计方法的思路构建了该估计系统的总体模块设计,然后遵照解耦的原则设计了测量、存储、用户使用分离的网络拓扑结构,在此基础上编写代码进行了各个模块的功能实现,最后设计了用户使用该系统的两种主要交互方式。