论文部分内容阅读
在现代RAID系统中,可靠性和性能是最重要的两个方面。在存储介质中利用纠删码可以提高可靠性。多年来研究人员尝试利用单奇偶校验、镜像、最大距离可分码等不同方案来容错和备灾。但最新理论表明,随着新技术的应用和新理论的发展,这些技术不能很好得应对新问题。目前,研究人员着手利用条带写数据时的纠删码技术方案提高存储可靠性。本文的研究成果是在RAID存储系统中提高了错误数据的恢复效率和概率。论文的第一部分,分析了RAID6的工作机制、奇偶校验码写入机制、以及数据和校验码更新机制。同时这一部分引出了一种新方案,利用双纠删码来解决错误数据恢复问题。在实现这一方案的过程中,我们发现现有的很多技术方法不能很好的处理大规模数据存储系统,比如只能处理单一磁盘的错误。文中提出的新方法可以在一定程度上克服上述弊端,利用双纠删码在校验盘的基础上恢复数据。论文的第二部分,研究了RAID中单个磁盘的数据分布机制,即数据条带化。所谓条带化,是指将数据分块,并将这些数据块均衡分布到存储系统的不同磁盘的不同区域。条带数据块大小是一个重要参数,会极大影响各个磁盘的读写性能。随着磁盘技术的发展,以及IO优化技术的出现,有必要进一步分析研究这些变化给条带化带来的新影响。文中对此做了阐述。第三部分,描述了RAID6系统中发生数据错误时的恢复方法。RAID6具有高容错性,但恢复效率差,每一校验集都需独立计算,尤其影响写效率。当存储系统中的某一数据出错时,整个容错阵列都会受到很大影响。为此,我们设计了多种方法在数据重建过程中消除错误数据影响。最后,我们使用纠删码来分析和优化RAID6中的分块,并采用XOR技术恢复失败或崩溃的数据,减少使用阵列资源来降低重建的不利因素。在这个RAID级别,我们使用2个奇偶校验设备和校验技术构造扩展阵列,以容许任何一个或两个存储设备故障。在此过程中新旧两种都要应用于校验数据的计算中。在更新存储系统中,会实施6步操作(读数据、写数据、读写两个校验盘),由此可以应对数据灾害。论文的主要贡献为:1、分析了双纠删码技术,并验证了其在RAID中数据容错应用的有效性。2、改善了RAID中利用两块校验盘进行小写的性能。3、基于XOR技术优化了利用纠删码在RAID中恢复数据的方案。