基于局部性编码的分布式存储容错机制研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:a348956376
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前社会产生的大量数据需要更好的存储解决方案。近年来,基于网络技术的分布式存储,将数据存储在多个廉价设备上,已经得到了广泛的应用。但是考虑到系统的规模,系统中的构成节点以及其它网络组件故障已经是常见的情况。为了保证数据的可用性,就需要引进一定的冗余,而数据长期的可靠性,则依赖于对丢失冗余的修复。分布式存储系统一般采用复制策略产生冗余。最近,能够提供更好存储效率的纠删码已经被用来减少三副本系统中的大量存储开销。然而在修复过程中,纠删码要从多个节点中下载大量的数据,并不是修复丢失冗余的高效方案。为了解决这个问题,本文提供两种局部性编码技术,以减少修复过程中所需的修复带宽和修复局部性(称修复过程中需要连接的节点数为修复局部性)。   1.通过将(n,k)RS编码和X编码结合,为分布式存储系统设计了一类新的准确修复编码—(n,k,f)X再生码(XRC),其中RS编码用于提供容忍n-k个节点故障的可靠性,X编码则用在RS编码之上,提供对单个或者两个节点故障的高效准确修复。一个显著的优势是在修复过程中,需要连接的节点数可以设置成与n,k独立的较小常数。文中对X再生码的存储代价、修复带宽、修复局部性和编码率进行了分析,并与RS编码、复制以及SRC进行了对比。结果显示,X再生码在修复一个或者两个节点故障时,在修复局部性以及修复带宽上都具有显著的优势,并能达到任意高的编码率。我们提供了使用马尔科夫模型估计平均数据丢失时间的可靠性分析,对XRC,RS编码,复制的可靠性进行了对比。X再生码的可靠性与RS编码相比有了显著的提升。   2.介绍了另一类新的准确修复编码,由RS编码和复制两部分结合而成,RS编码用于保证分布式系统的(n,k)性质,复制用于保证高效的无编码修复,我们称这种新编码为R再生码。文中主要介绍了两种:基于两副本的(n,k,2)-R再生码,以及基于三副本的(n,k,3)-R再生码。(n,k,2)-R再生码可以对一个节点故障进行无编码的修复,修复局部性为2,编码率为k/2n。(n,k,3)-R再生码可以对两个节点同时出现故障进行无编码的修复,修复局部性为3,编码率为k/3n。R再生码的容错能力与RS编码一致,随着n,k的增大(n-k固定),存储开销可以与相应的复制策略任意接近。
其他文献
近年来,随着全球定位系统、地理信息系统、卫星数据处理、计算机辅助设计及移动计算等领域的迅速发展,针对移动对象的空间数据查询研究得到了国内外研究者的广泛关注,然而,随着移
面对快速增加的数据量,如何存储管理数据、如何保证数据的安全可靠成为数据拥有者比较关注的问题。因其可靠性、冗余性、高性价比、伸缩性和底层实现对用户的透明性,基于云的数
作物的三维信息获取在农田机械视觉导航及作物种植、收割、农药喷施、除草和蔬菜嫁接等方面的作用越来越大,可为现代农业作业提供作物生长的坐标信息,具有很大的应用前景。本
随着蛋白质组学研究的推进,以及高通量实验技术的快速发展,蛋白质组学中关键蛋白质的研究进入了一个新的发展时期。关键蛋白质是生物体存活和繁殖所必需的蛋白质,在生命活动过程
射频识别(RFID)作为一种高性价比的传感识别的使能技术,日渐在零售、制药、医疗保健和物流管理等领域得到各种大规模应用。然而,RFID事件流具有时序性,动态性,数据量大,包含隐含语
移动Ad Hoc网络作为一种无线网络,拥有组网方便、对硬件要求不高、不需要固定中心等特点。虽然Ad Hoc网络最早是针对军事所设计的,但随着软、硬件的高速发展,Ad Hoc网络已进入了
本文对短信分类的关键技术做了深入的讨论。结合贝叶斯分类的文本分类方法和Bigram分词的方法,并提出在移动手机终端进行双层短信过滤模型,对传统的文本分类进行了改进,有效
普适计算力图将以计算机为中心的计算模式转变为以人为中心的计算模式,其目标是构建一个计算和通信无处不在的环境,并在此基础上透明地提供以人为中心的服务。获取物体的位置信
随着集成电路制作工艺的不断发展和半导体尺寸的日益缩小,存储器的密度越来越大。随着存储器密度和复杂度的快速增长,存储器发生故障的概率越来越高,故障种类也越来越多,这使得存
目前绝大多数的文字识别(OCR)系统,只能识别单一文种的文字,无法同时识别多文种文字。而现有的大量蒙古文文档图像中不仅包含蒙古文,还混有汉文和英文。如果识别时仅使用蒙古