论文部分内容阅读
针对目前主流分布式处理平台数据冗余因子过大、数据可用性不高的问题,提出基于改进RS编码的二次分块数据存储方法。将分布式环境中的文件块分成多个数据子块,利用RS编码对其进行编码,并分布存储到不同机器节点中,以减少数据冗余。实验结果表明,该方法能有效降低数据冗余度,提高数据可用性,减少任务执行时间。