论文部分内容阅读
随着现实应用中数据量的增加,副本或者镜像与纠删码技术协作的分层冗余存储模式因具备高存储空间利用率,高可靠性,高性能等优势在分布式存储系统中被广泛应用。蓝鲸分布式SAN集群BW-RAID在设计上采用镜像与纠删码协作的架构,提高系统可靠性和性能的同时降低副本参数。本文针对异步BW-RAID集群解决方案中保证系统冗余一致性面临的关键问题,重点研究了分布式冗余数据版本机制,在保证系统冗余一致性的前提下,提高了异步解决方案的整体系统性能。本文的主要工作与贡献如下: 基于分布式异步精确时间的数据版本机制:针对分布式镜像数据一致性识别问题,提出了一种基于分布式异步精确时间的数据版本机制ADOP,包括数据版本刻画定义和版本比较方法。其特点是:(1)无中心的分布式异步版本管理,数据版本由存储节点独立维护,并且存储节点间的时钟无需完全同步。(2)存储系统运行状态无关性,存储系统正常状态、故障恢复状态时均适用。(3)数据版本维护具有存储协议无关性,适用于标准存储协议。 基于分布式异步模糊时间的数据版本机制:针对ADOP的局限性和限制条件,提出了基于广义模糊时间的数据版本机制CGFA,包括时间语义弱化及版本比较方法扩展,版本合并方法,版本完善方法。其特点是:(1)时间语义兼容性强,支持基于弱时间语义的版本管理。(2)应用模式自适应性强,首先,同一逻辑地址被多次覆盖写时可以保证数据与版本一致,自适应于非对齐覆盖写、对齐覆盖写并存的应用。其次,数据版本维护与应用更新解耦合,所有镜像数据可以按需执行版本比较。实验表明,CGFA可以保证存储系统正确性。配置了CGFA的异步方案与同步模式方案相比,顺序写评测的冗余写IO负载低于0.5%,平均带宽最高提升26.73%,吞吐量稳定性平均提升51.16%。典型负载评测中平均lOPS提升4.64%-32.61%,平均写响应延迟降低9.05%-4.32倍。 低开销、高效率的版本维护优化方法LOLM:针对CGFA存在的内存开销及一致版本漏判问题,提出了一种低开销、高效率的优化方法LOLM,它可以根据存储节点的内存使用情况弹性收缩版本项占用的内存空间,同时通过对符合条件的数据的版本比较进行合理延迟,降低一致版本漏判率。存储压力评测中配置了LOLM的异步方案产生的内存开销降低幅度大于99.3%,冗余IO开销增幅小于1.96%,与同步模式方案相比平均带宽提升13.96%-21.73%,吞吐量稳定性平均提升52.59%。典型负载评测中漏判率降低3.85%-9.76%,与同步模式相比平均lOPS提升2.49%-28.48%,平均写响应延迟降低22.36%-4.82倍。