论文部分内容阅读
跟着爱数备份容灾家族百城巡展的脚步,爱数一体化容灾的理念走进了全国三十多个城市,获得了用户朋友的广泛认可。爱数一体化容灾解决方案需要同时解决两个问题:数据不丢失和应用不间断。其中,数据不丢失是基础,而应用不间断则是目标。那么,如何实现应用不间断呢?
基于 CDP 技术的应用容灾
爱数一体化容灾解决方案分为三个部分:生产服务器、容灾服务器和基于爱数容灾家族产品成员的容灾管理控制台。这三个部分通过实时复制和持续恢复两项关键技术,紧密地连接在一起。
实时复制技术负责监控生产服务器上用户选择的数据源,并将数据传输到爱数第三代引擎所特有的 OFS 介质(下文简称 OFS)上。用户可以通过该技术追溯到在任何时间传输的数据。
为了使容灾服务器和生产服务器的数据保持一致,当OFS 上的数据有变化时,持续恢复技术就会将变化的数据实时复制到容灾服务器上。如果OFS 出现应用中断的情况,容灾服务器能将数据恢复到应用中断的那个时间点。这样就能够实现容灾服务器的恢复点目标(RPO)接近于 0。
如果生产服务器上的应用发生故障,容灾系统的故障检测模块就会马上发挥作用。它会先排除各种异常情况,并尝试修复生产服务器的应用程序。如果应用无法修复,容灾服务器就会自动接管生产服务器的应用(用户也可设置成手工接管,爱数的管理控制台会在应用出现故障时发出通知)。
容灾服务器顺利接管了生产服务器上的应用后,并不意味容灾过程结束了。接管应用后的容灾服务器同时还在对外提供服务,所产生的数据依然需要保护。这时,爱数应用容灾的对象随着应用切换,变成容灾服务器。为了让原来的生产服务器继续工作,用户往往需要修复生产服务器,生产服务器被修复好后,爱数一体化容灾解决方案可以通过特有的反向复制技术实时地将容灾服务器产生的数据通过 OFS 复制到生产服务器上。复制完成后,用户只要再进行一次反向接管,即可将应用切换到生产服务器上。
在爱数一体化容灾解决方案中,应用中断的时间只相当于一次应用接管的时间。纵观整个容灾和应用恢复的过程,应用中断时间(RTO)仅为两次接管的时间。
在传统的容灾解决方案中,容灾服务器接管并恢复生产服务器的应用时,为了保证数据一致,一般会被要求在数据恢复过程中停止对外提供服务。由于传统方案中的数据恢复时间会受到数据量的大小和网络链路状况的限制,常常导致数据恢复时间较长。爱数一体化容灾解决方案能够大幅度地降低应用间断的时间。
基于级联复制的远程应用容灾
除了上述容灾解决方案外,爱数备份容灾家族还提供了十分安全可靠的远程级联复制容灾方案。
所谓级联,就是在不同的地点部署容灾系统,利用 OFS 的同步功能,将远程容灾中心和本地数据中心的数据进行连接,实现同步。这种数据同步也是实时的, OFS在通过远程操作时同样可以将数据恢复到任意时间点。由于异地容灾一般是在低速网络中进行,网络速度会影响容灾的效果,为此爱数专门研发支持断开重连、断点续传等网络传输技术,让远程的数据一致性得到了保证。
如果用户在远程容灾中心部署容灾服务器,就会有至少四份数据同时被保存下来。生产服务器上的应用发生故障时,用户可以选择使用本地或者异地的容灾服务器进行接管。如果本地容灾系统瘫痪,用户可以选择使用远程的 OFS 数据。即使本地数据中心发生极端的灾难性事故,甚至发生数据中心全部损毁的情况,远程容灾服务器依然可以接管生产服务器的应用,并可以将数据状态恢复到任意时间点。
灾难过后,如果用户需要修复本地数据中心的生产服务器和容灾服务器,同样也可以通过远程 OFS 进行数据恢复,解决了数据恢复时间长、远程数据可能不一致的问题,使应用中断时间(RTO)降到极短。
爱数备份容灾家族采用了实时复制、持续恢复、反向复制、级联复制等一系列独特的技术手段,保证关键应用持续运行,力求将应用中断的时间极小化,为用户提供了安全可靠的应用容灾解决方案。爱数应用容灾方案和数据容灾方案都是一体化容灾解决方案不可或缺的重要组成部分。
基于 CDP 技术的应用容灾
爱数一体化容灾解决方案分为三个部分:生产服务器、容灾服务器和基于爱数容灾家族产品成员的容灾管理控制台。这三个部分通过实时复制和持续恢复两项关键技术,紧密地连接在一起。
实时复制技术负责监控生产服务器上用户选择的数据源,并将数据传输到爱数第三代引擎所特有的 OFS 介质(下文简称 OFS)上。用户可以通过该技术追溯到在任何时间传输的数据。
为了使容灾服务器和生产服务器的数据保持一致,当OFS 上的数据有变化时,持续恢复技术就会将变化的数据实时复制到容灾服务器上。如果OFS 出现应用中断的情况,容灾服务器能将数据恢复到应用中断的那个时间点。这样就能够实现容灾服务器的恢复点目标(RPO)接近于 0。
如果生产服务器上的应用发生故障,容灾系统的故障检测模块就会马上发挥作用。它会先排除各种异常情况,并尝试修复生产服务器的应用程序。如果应用无法修复,容灾服务器就会自动接管生产服务器的应用(用户也可设置成手工接管,爱数的管理控制台会在应用出现故障时发出通知)。
容灾服务器顺利接管了生产服务器上的应用后,并不意味容灾过程结束了。接管应用后的容灾服务器同时还在对外提供服务,所产生的数据依然需要保护。这时,爱数应用容灾的对象随着应用切换,变成容灾服务器。为了让原来的生产服务器继续工作,用户往往需要修复生产服务器,生产服务器被修复好后,爱数一体化容灾解决方案可以通过特有的反向复制技术实时地将容灾服务器产生的数据通过 OFS 复制到生产服务器上。复制完成后,用户只要再进行一次反向接管,即可将应用切换到生产服务器上。
在爱数一体化容灾解决方案中,应用中断的时间只相当于一次应用接管的时间。纵观整个容灾和应用恢复的过程,应用中断时间(RTO)仅为两次接管的时间。
在传统的容灾解决方案中,容灾服务器接管并恢复生产服务器的应用时,为了保证数据一致,一般会被要求在数据恢复过程中停止对外提供服务。由于传统方案中的数据恢复时间会受到数据量的大小和网络链路状况的限制,常常导致数据恢复时间较长。爱数一体化容灾解决方案能够大幅度地降低应用间断的时间。
基于级联复制的远程应用容灾
除了上述容灾解决方案外,爱数备份容灾家族还提供了十分安全可靠的远程级联复制容灾方案。
所谓级联,就是在不同的地点部署容灾系统,利用 OFS 的同步功能,将远程容灾中心和本地数据中心的数据进行连接,实现同步。这种数据同步也是实时的, OFS在通过远程操作时同样可以将数据恢复到任意时间点。由于异地容灾一般是在低速网络中进行,网络速度会影响容灾的效果,为此爱数专门研发支持断开重连、断点续传等网络传输技术,让远程的数据一致性得到了保证。
如果用户在远程容灾中心部署容灾服务器,就会有至少四份数据同时被保存下来。生产服务器上的应用发生故障时,用户可以选择使用本地或者异地的容灾服务器进行接管。如果本地容灾系统瘫痪,用户可以选择使用远程的 OFS 数据。即使本地数据中心发生极端的灾难性事故,甚至发生数据中心全部损毁的情况,远程容灾服务器依然可以接管生产服务器的应用,并可以将数据状态恢复到任意时间点。
灾难过后,如果用户需要修复本地数据中心的生产服务器和容灾服务器,同样也可以通过远程 OFS 进行数据恢复,解决了数据恢复时间长、远程数据可能不一致的问题,使应用中断时间(RTO)降到极短。
爱数备份容灾家族采用了实时复制、持续恢复、反向复制、级联复制等一系列独特的技术手段,保证关键应用持续运行,力求将应用中断的时间极小化,为用户提供了安全可靠的应用容灾解决方案。爱数应用容灾方案和数据容灾方案都是一体化容灾解决方案不可或缺的重要组成部分。