论文部分内容阅读
P2P文件共享是目前Internet上最主要、最成功的对等网络(Peer-to-Peer,P2P)应用,而且P2P文件共享应用已经成为当今互联网流量的重要组成部分。然而由于P2P文件共享系统中参与节点以自组织方式建立P2P网络,具有很强的随意性和自发性。并且相对于传统的互联网应用而言,新出现的P2P文件共享应用产生的流量更大,体现出的特征更复杂。因此,研究P2P文件共享系统的行为特性有助于深入了解P2P文件共享系统的特点并对提高P2P文件共享系统的性能、稳定性、可扩展性以及对网络流量进行合理有效地管理和控制产生积极的意义。
准确有效的数据是保证正确地分析和模型P2P文件共享系统的基础。通过获取Maze文件共享系统的用户日志和收集Maze应用的网络流量信息,本文研究了P2P文件共享系统的行为特性,并根据P2P文件共享系统的行为特点研究了P2P文件共享系统中文件传播的模型和影响因素。本文的研究内容和创新性工作主要包括以下几个方面:
1.通过研究Maze系统的用户日志,证实P2P文件共享系统的用户请求和负载传输具有很强的时间特性并利用傅立叶变换研究了这种行为的周期性特点。通过对Maze文件共享系统被下载文件的长度和类型的分类,研究了其负载来源及组成。在文件共享系统中用户具有不同的行为,利用用户日志本文对用户进行了分类并研究了不同类型用户的行为异同以及这些行为之间的关系。
2.经过分析Maze系统的网络流量数据,发现虽然在Maze应用中少部分流占据了流量的大部分内容,但是这个程度要低于WWW(World Wide Web)应用和整个链路的比例。本文也证实了极少部分主机传输了大部分流量的观点,但是这个程度要低于以前的研究结果。基于流长和流持续时间对流分类后,本文研究了Maze应用流的组成特点。而针对流的自相似性分析表明,流的到达间隔时间和流的到达速率表现出了明显的自相似性。
3.分布模型对于模拟和仿真P2P文件共享系统的性能和特点具有重要的作用。使用对数正态分布本文建立了Maze文件共享系统中用户活跃时间和传输时间以及Maze应用网络流量中的流持续时间分布模型。使用对数正态混合分布,建立了Maze文件共享系统中用户的上传流量和下载流量、用户上传带宽和下载带宽,以及Maze应用网络流量中的流长、流传输速率分布模型。还利用指数分布和Pareto分布的混合分布建立了Maze文件共享系统中用户请求次数和被请求次数的分布模型。
4.通过分析P2P文件共享系统的特点提出了利用基于空间动力的传染病动力学模型来描述P2P文件共享系统中的文件传播行为并通过分析用户节点的状态变化和数量变化建立了该模型。通过使用Maze系统用户日志中的数据,验证了该模型在描述最为流行的视频文件的传播行为时具有良好的效果。
5.提出了P2P文件共享系统中描述文件传播效率的基本再生数公式。基于这个公式本文考察了不同因素对文件传播的影响。根据实验的结果,我们发现在P2P文件传播过程中,提高用户的下载完成速率、共享概率、共享时间、在线时间都会对文件的传播过程产生积极的影响。但是只有增大用户对文件的共享概率所带来的作用最明显。