论文部分内容阅读
P2P系统中冷门文件(依据种子数或副本数)凭借其巨大的数量基数,收到不容忽视的用户请求比例。然而,由于冷门文件在P2P系统中缺少足够的上线副本,下载该类文件通常会遭遇文件不可用或下载速度慢。传统研究提出了众多方法试图解决该问题,但是受限于节点动态性高,激励机制不完善,部署成本大等原因,这些方法在实际环境下效果甚微。因此,在多年的发展过程中,文件不可用和下载速度慢的问题一直困扰着P2P系统。 近期,一种新型数据获取方式,内容预约服务(又称云下载或离线下载),由若干商业P2P系统发起,帮助用户下载冷门文件。内容预约服务利用稳定服务器接管用户的下载请求,并持续的在原有P2P系统中搜索和下载数据。当文件被完全下载至服务器端后,再通知用户返回系统,将文件从服务器端取至本地。实践结果已证明,内容预约服务能够有效提高文件的下载成功率,是一个极具潜力的下载方式。它的一个重要特点是由于服务器接管了用户的下载请求,所以用户不需要长时间挂机等待,不用改变自身的上网习惯,因此内容预约服务一经推出即受到用户的广泛欢迎。目前,该服务尚处起步阶段,缺少深入的相关研究,仍存在许多关键问题尚未解决。本文即研究内容预约服务的相关机制及核心技术,针对其在性能,成本等重要方面存在的问题,提出具体可行的解决方法。本文的主要贡献包括:1)探索内容预约服务的性能上限,刻画整体性能特征,以及预测单任务预期性能;2)设计并实现了(2万9千余行C++代码)一个基于P2P存储的低开销内容预约服务,解决当前内容预约服务在设备和带宽方面的巨大开销;3)提出基于用户协作的高吞吐数据消重方案,从而有效利用存储空间,降低内容预约服务的存储开销;4)针对广域P2P环境下数据连接不稳定、易失败、易拥塞等问题,提出采用覆盖层路由提升端到端通信性能,研究联合的优化连接时延性能和跨自治域系统流量开销。