论文部分内容阅读
激励策略是决定对等文件共享系统成败的关键因素之一。近年来,私密BitTorrent作为一种基于账号的新型对等文件共享系统,用户的做种意愿相较于传统BitTorrent系统得到极大提升。私密BitTorrent站点的内容的可用性和用户下载速度大幅提高,因而获得广泛应用。一方面私密BitTorrent的账户机制使得从用户层面对BT使用者的长期行为进行研究成为可能,另一方面其实现的多样性、激励策略的复杂性也为研究工作设置了诸多障碍。 目前,国内外针对私密BitTorrent技术的研究方兴未艾,尚存在一些亟待深入探究的问题。首先,作为激励策略评估和设计的基础,如何保证对私密BitTorrent进行测量和分析工作的准确性问题。站点的类型复杂、实现多样;账户难于获取、获取信息受限;网站中常并存多种激励策略和用户管理策略,且策略间有相互影响,现有的私密BitTorrent测量研究未能反映网站和用户的真实情况。其次,激励策略作为用户管理策略的一部分,现有研究缺乏对于一个账号从创建到消亡的历程的完整认识。缺乏正确的测量分析方法就不可能获得正确的分析结果;缺乏对用户的完整理解,就很难设计出针对性的激励策略。此外,好的激励策略必然从实践中来,并为满足实际的需求而生。现有的激励策略,单纯以流量或者做种所需的存储成本或者时间成本来计算用户的成本收益,这使得激励本身为用户创造出“作弊”空间。 针对如何测量和分析私密BitTorrent站点的不准确性问题,分别从数据源分析、爬虫设计和数据分析三个阶段展开分析。私密BitTorrent网站小而散的特点,使得数据源本身就存在各种问题,需要加以辨别。在数据源分析时,应当注重所获取数据的语义分析及其更新频率分析。而根据研究目的,应当利用所获知的数据更新频率及数据集之间的相关性等信息,为爬虫设计提供更有效的支持,从而避免无效爬取、获得无偏的样本数据集、发掘缺失或隐藏的信息。私密BitTorrent中规则和协议的多样性和复杂性亦会导致数据分析结果出现偏差。例如,研究发现忽略Partial Seed的情况会导致分析结果存在很大误差。脱离用户账户管理的整体去谈论单一的激励策略,获得的结论就会有很大的局限性。针对现有私密BitTorrent中的用户管理策略的激励效果问题,研究发现从已注册用户中获取邀请是困难的,具有某个邀请数的用户数与用户的邀请数大致呈负指数分布。用户被封禁或删除的主要原因并非是上传带宽不足,而是其参与度不够以及相较于其他用户更低的做种意愿。高等级用户不仅是上传量大,在做种数和对于濒死种的保种方面也远高于低等级用户。分析表明SRE封禁策略在选择/过滤用户的作用更甚于其所起的激励作用。这说明用户注册/封禁策略在保证系统的有效性的同时,也极大的限制了网站的用户数。 通过对已有私密Bittorrent激励策略的分析,研究发现当前的私密BitTorrent社区存在两个问题,一是有下载请求但是内容并不可用,二是内容可用却缺少下载请求。这需要将以提高用户下载速度和内容可用性的设计目标,修正为以提高用户请求命中率为设计目标(用户请求时保障其内容可用)。研究发现系统中存在非真实使用需求的下载行为,其目的仅为获取做种收益。一些内容的参与者甚至基本由怀有此种目的的下载者和做种者组成。这些虚假行为完全偏离了系统的设计目标。由于不同私密BitTorrent网站用户群的带宽差异,单纯以流量为标准并不能够衡量用户的下载成本和做种收益。通过分析现有策略的不足,得出进行激励设计所需遵循的基本原则。其一,用户的下载支出计算时,需以其他用户的保种支出为计算依据,以此来反映用户的真实需求。其二,用户的做种收益,应当正比于用户为系统设计目标实现所作出的贡献。其三,激励策略应当尽量简单且具有可行的反作弊机制。最后,给出基于用户请求模型的激励策略,并根据真实的用户请求日志进行仿真验证。 通过激励策略的设计模型和仿真结果,为提高私密Bittorrent等分布式文件共享系统的可用性提供坚实的认知基础,对于运营维护私密Bittorrent或类似系统具有重要的理论意义和实际意义。