论文部分内容阅读
为了使得应用具有更高的性能、可伸缩性和可用性,并且减少硬件成本,越来越多的互联网应用开发人员选择为应用在云基础设施上构建云服务。随着云服务开发的需求的增加,有必要为云服务开发提供工具、公共服务及开发框架支持。
鉴于云环境中节点宕机、网络分区等故障时有发生,基于复制技术的复制框架被用来提高云服务的可用性和容错能力。复制框架通过数据/服务的复制,可以为云服务提供高可靠性,另一方面,复制框架还能将云服务对副本操作的一致性要求抽象成API,并提供相关的一致性支持。基于复制框架开发云服务,可以有效缩短云服务的开发周期。
本论文在调研了多种应用需求的基础上,设计和实现了复制框架Once-Replication。复制框架基于主动复制的策略,采用基于时间戳的反熵协议实现更新的传播,提供了因果操作、强制操作和即时操作三种不同的一致性保证,具有故障检测、故障恢复和重配置能力。这样,云服务的设计者可以依据服务特点,在模块级别注册服务的一致性要求,复制框架则根据用户注册的要求,对不同应用、同一应用不同模块的更新操作采用不同的复制策略。另外,论文还通过在复制框架上构建并运行云服务的原型系统,验证了复制框架Once-Replication能够有效地为云服务正确地提供一致性保证,并在有故障情况下正常地提供服务。