私密BitTorrent激励机制的测量与分析研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xumingxingHUANG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
激励策略是决定对等文件共享系统成败的关键因素之一。近年来,私密BitTorrent作为一种基于账号的新型对等文件共享系统,用户的做种意愿相较于传统BitTorrent系统得到极大提升。私密BitTorrent站点的内容的可用性和用户下载速度大幅提高,因而获得广泛应用。一方面私密BitTorrent的账户机制使得从用户层面对BT使用者的长期行为进行研究成为可能,另一方面其实现的多样性、激励策略的复杂性也为研究工作设置了诸多障碍。  目前,国内外针对私密BitTorrent技术的研究方兴未艾,尚存在一些亟待深入探究的问题。首先,作为激励策略评估和设计的基础,如何保证对私密BitTorrent进行测量和分析工作的准确性问题。站点的类型复杂、实现多样;账户难于获取、获取信息受限;网站中常并存多种激励策略和用户管理策略,且策略间有相互影响,现有的私密BitTorrent测量研究未能反映网站和用户的真实情况。其次,激励策略作为用户管理策略的一部分,现有研究缺乏对于一个账号从创建到消亡的历程的完整认识。缺乏正确的测量分析方法就不可能获得正确的分析结果;缺乏对用户的完整理解,就很难设计出针对性的激励策略。此外,好的激励策略必然从实践中来,并为满足实际的需求而生。现有的激励策略,单纯以流量或者做种所需的存储成本或者时间成本来计算用户的成本收益,这使得激励本身为用户创造出“作弊”空间。  针对如何测量和分析私密BitTorrent站点的不准确性问题,分别从数据源分析、爬虫设计和数据分析三个阶段展开分析。私密BitTorrent网站小而散的特点,使得数据源本身就存在各种问题,需要加以辨别。在数据源分析时,应当注重所获取数据的语义分析及其更新频率分析。而根据研究目的,应当利用所获知的数据更新频率及数据集之间的相关性等信息,为爬虫设计提供更有效的支持,从而避免无效爬取、获得无偏的样本数据集、发掘缺失或隐藏的信息。私密BitTorrent中规则和协议的多样性和复杂性亦会导致数据分析结果出现偏差。例如,研究发现忽略Partial Seed的情况会导致分析结果存在很大误差。脱离用户账户管理的整体去谈论单一的激励策略,获得的结论就会有很大的局限性。针对现有私密BitTorrent中的用户管理策略的激励效果问题,研究发现从已注册用户中获取邀请是困难的,具有某个邀请数的用户数与用户的邀请数大致呈负指数分布。用户被封禁或删除的主要原因并非是上传带宽不足,而是其参与度不够以及相较于其他用户更低的做种意愿。高等级用户不仅是上传量大,在做种数和对于濒死种的保种方面也远高于低等级用户。分析表明SRE封禁策略在选择/过滤用户的作用更甚于其所起的激励作用。这说明用户注册/封禁策略在保证系统的有效性的同时,也极大的限制了网站的用户数。  通过对已有私密Bittorrent激励策略的分析,研究发现当前的私密BitTorrent社区存在两个问题,一是有下载请求但是内容并不可用,二是内容可用却缺少下载请求。这需要将以提高用户下载速度和内容可用性的设计目标,修正为以提高用户请求命中率为设计目标(用户请求时保障其内容可用)。研究发现系统中存在非真实使用需求的下载行为,其目的仅为获取做种收益。一些内容的参与者甚至基本由怀有此种目的的下载者和做种者组成。这些虚假行为完全偏离了系统的设计目标。由于不同私密BitTorrent网站用户群的带宽差异,单纯以流量为标准并不能够衡量用户的下载成本和做种收益。通过分析现有策略的不足,得出进行激励设计所需遵循的基本原则。其一,用户的下载支出计算时,需以其他用户的保种支出为计算依据,以此来反映用户的真实需求。其二,用户的做种收益,应当正比于用户为系统设计目标实现所作出的贡献。其三,激励策略应当尽量简单且具有可行的反作弊机制。最后,给出基于用户请求模型的激励策略,并根据真实的用户请求日志进行仿真验证。  通过激励策略的设计模型和仿真结果,为提高私密Bittorrent等分布式文件共享系统的可用性提供坚实的认知基础,对于运营维护私密Bittorrent或类似系统具有重要的理论意义和实际意义。
其他文献
在信息经济时代,人们越来越关注使用信息技术和全新的管理观念来提高公共机构和政府的业务水平。将信息技术与政府政务工作结合起来,充分利用网络和各种新技术使公众、合作伙
集群系统以其本身所具有的高性价比、可扩展性和可靠性等优点逐渐成为高性能计算领域里令人瞩目的焦点。如何提高集群系统的运行效率、可用性和易用性是集群计算领域的一个重
网络技术的飞速发展及其广泛的应用,使网络上的通信量和网络系统本身的复杂度日趋增大。在这种情况下,我们设计并完成了“基于Internet的动态网络管理系统”,对网络进行管理
图像不仅仅是互联网通信最重要的工具,同时也是传播信息非常重要的载体。随着微博、微信等新型的交流工具涌入我们的生活,使用图像记录每时每刻的状态已经成为人们生活最重要
本文设计并实现了一个安全文件系统SecNFS。它既可以挂载在NFS之上构筑安全网络文件系统,也可以挂载在EXT2之上组成本地加密文件系统。通过对现有各类安全文件系统的研究与分
作为日渐成熟的技术,云计算数据中心的资源规模正在以指数级方式膨胀。云平台本身有着大规模的组件和超复杂的组件间依赖,记录云平台的大规模监控数据时会对云平台的存储系统带
论文“协作学习系统的分析与实现”是结合科技部十五重大科技攻关项目“网络教育技术及示范工程”的“非实时教学系统”课题进行的。论文旨在研究基于Internet的协作学习的关
随着计算机技术的发展,高性能微处理器和高速计算机网络的出现,使得把由大量CPU组成的计算系统通过高速网络连接在一起成为一件容易的事情。JMS作业管理系统就是一种建立于操
数据挖掘技术是当今智能系统理论的重要研究内容,它综合运用人工智能、计算智能(人工神经网、遗传算法)、模式识别、数理统计等先进技术从大量数据中挖掘和发现有价值和隐含的
在线社会网络作为复杂网络的一种,具备复杂网络的一些拓扑特性,比如小世界性、无标度性和社区结构。近年来随着在线社会网络的快速发展,越来越多的研究者开始对在线社会网络