论文部分内容阅读
基于高速主干互联网的IP流数据对研究网络具有非常重要的价值,但实际公布的这类数据很少,尤其是没有经过抽样处理的原始数据,原因主要在于主干信道采集难度大和lP地址隐私等方面。由于基于主干网IP流数据的匮乏,网络研究人员往往借助仿真方法产生基于主干网的实验数据,进而影响到研究结果的正确性和准确性。为此,CERNET华东(北)网络中心在国家重点基础研究发展计划(973计划)课题“网络动态行为和传输控制理论”的支持下,采集了一些CERNET主干网的IP流数据并拟对外发布。论文的基本任务是设计并实现一个IP流数据净化系统,用该系统将要发布的数据作净化处理,将结果在互联网上公布,以向更多研究网络的需求者共享。
论文在研究目前国外流净化处理算法的基础上,根据原始流数据自身特点,设计了一个灵活易用的IP流净化处理系统。
首先,论文对目前国内外IP流净化方法进行了研究,介绍了这些方法中的净化内容,所使用的算法,由于流净化的核心内容是IP地址匿名化,而能最大程度保留流数据原始特性的是IP地址前缀保留的匿名化,因此,论文着重研究了前缀保留IP地址匿名化算法TCPdpriV和Crypto-PAn,对上述两种算法进行了详细分析、实测与评价。然后对影响数据净化的因素进行了分析。
其次,从实际需求出发,参照国内外最近出现的研究成果,在综合现有的IP地址前缀保留的匿名化方法的基础上,提出了基于Crypto-PAn的改进算法PC-PAn和PSC-PAn,论证了改进的可行性和正确性。在此基础上,论文给出了系统的总体结构设计,实现了一个可选级别、可选内容、可选方法、具有分布式并行处理能力的流净化处理系统,并用该系统将CERNET华东(北)地区网络中心某个省网边界采集到的IP流数据进行净化处理,向研究者提供数据下载服务。
再次,从系统的处理能力、数据安全性等方面对系统的性能进行了测试和分析,结果表明,改进后的地址匿名化算法效率大大提高,系统能够满足主干网络流数据净化的要求。