论文部分内容阅读
飓风考验数据中心
2012年10月,桑迪飓风在美国新泽西州登陆,造成了巨大的人员、财产损失。其中就包括对当地一些数据中心带来了巨大影响,部分数据中心甚至业务一度中断。
桑迪飓风造成托管服务提供商Internap公司位于纽约市中心的数据中心严重进水,数据中心后备电力系统的燃油泵被迫关闭。当时,Internap不得不改用较高楼层另一只储有1200加仑燃油的储备油箱,才得以保证服务器在飓风期间正常运行。
近几年,卡特里娜飓风等一系列飓风给墨西哥湾沿岸地区造成了巨大的破坏,也给Entergy公司的数据中心带来了影响。Entergy公司是一家位于新奥尔良的电力公司,为280万户客户提供电力服务。
Entergy公司在路易斯安那州格雷特纳建有一个数据中心,毗邻密西西比河。Entergy公司的CIO Jill Israel说:“虽然在卡特里娜飓风期间,我们数据中心邻近地区没有被淹,但当时整个电力系统瘫痪,只能凭借备用发电机来提供电力。风暴过后,我们开始对数据中心的安全有所担忧,最后决定将整个数据中心搬迁。”
2006年冬天,Entergy公司决定在密西西比州杰克逊和阿肯色州小石城建造两个备用数据中心。在小石城,数据中心是利用一个旧图书馆返修而成,周围砌上了坚固的围墙。2008年之前,相应的关键应用从新奥尔良迁移到了这个备用数据中心。
2010年,Entergy公司又耗资3000万美元在密西西比州杰克逊建造了全新数据中心。Israel表示,公司在这两个数据中心之间对包括电子邮件系统在内的几个系统进行了负载均衡处理。“新的数据中心建成之后,我们又遇到了几次大风暴,包括小石城遭到的冰暴,但是我再也没有因为天气原因而担惊受怕了。”
Israel坦言,他们每年仍旧会针对飓风和风暴进行演练,以提高数据中心面对自然灾害时的响应能力。
不过,不是每家公司都能像Entergy公司这样保持如此高的警觉。众多欧洲和美国东北部的IT管理者仍旧认为超级风暴是小概率事件,是不会经常发生的不正常现象,不用太在意。甚至一些受到过大风暴影响的企业,管理人员在考虑IT优先事项时,会选择性地忘记气候变化,而不是像Israel那样保持警惕。
在曼哈顿市中心西街140号,Verizon的交换中心也曾经遭受了飓风桑迪的“蹂躏”,地下室以下五层,包括韦里逊的电缆室都进了水。飓风过后,Verizon用防风雨的光缆替换150吨重的已受损铜缆。Verizon企业解决方案公司全球客户服务保证部门副总裁Chris Kimm表示,通过更换电缆等基础设施,并搬到了较高楼层,各项服务得以在大概一周内恢复运行。
不过,尽管遭到了种种损坏,但Verizon没有考虑将其数据中心迁移到那些不常发洪水的地区。Kimm说:“我们对所有风险进行了再评估,对数据中心的基础设进行了加固。下一个飓风季节,将会考验这些应对措施的效果。”
长期规划应对灾害
气候变化对数据中心带来的影响很难估算。随着海平面和气温的上升,连气象学家也无法预测极端天气事件的发生。在美国一些地区,比如曼哈顿、长岛、新泽西州、迈阿密、弗吉尼亚海滩、波士顿、华盛顿、西雅图和圣迭戈,这种极端天气甚至有可能会有增无减。
鉴于“桑迪”飓风这样的自然灾害造成的可怕影响,人们不得不开始考虑,数据中心如何应对百年一遇、甚至千年一遇的恶劣气候带来的恶劣影响?面对这个问题,出现了两派声音。一方面,有人建议,数据中心只需加固现有的基础设施即可;另一方面,有人建议将数据中心搬到更安全的地方,例如地势较高的地方。
Internap主管开发和运营的高级副总裁Steve Orchard说:“没有人料到桑迪的破坏力会变得那么大。但加上前一年的飓风艾琳,我们看到气候趋势令人有点担忧。”
该公司已宣布正在新泽西州锡考克斯远离洪泛区的地方新建一个数据中心。Orchard说:“我们非常重视气候变化,气候变化确实是我们选择新址时所考虑的一个因素。”
调研机构451 Research公司的业务连续性和弹性专家Jim Grogan认为:“在数据中心建设中,有必要参考近期及中长期自然灾害的发生情况。每一起自然灾害都能带来相应经验教训,这些经验训练能够帮助数据中心运营者提高应对自然灾害的能力。”
新泽西州数据中心设计和咨询公司PTS数据中心解决方案公司的创始人兼总裁Peter Sacco认为,为什么美国东海岸大部分数据中心应对超级风暴的做法,只是加固现有的基础设施,其重要的一个原因是,“用户认为,现在计算机都是联网的,也就削弱了任何单一数据中心的重要性。大多数的数据中心负责人在数据中心选址时,大都会选择建设成本最低、投产最快的路子。”
Rakesh Kumar是Gartner公司的副总裁,专门研究数据中心和基础设施方面的问题。“各种自然灾害,例如寒冷气温、沿海洪水、海啸等不可知灾害事件,让以前被视为安全的地方现在也变得不安全了。不过,除非发生严重的数据停用事件,大多数的数据中心还是不会考虑气候变化带来的风险。”
有关调查发现,美国东海岸的公司大多没有主动地开展搬迁数据中心的计划。数据中心架构师Neil Sheehan表示,大多数公司选择了在同一地方进行扩建,根本没有迁址的想法。“例如我所在的公司,我们在为一些用户,在新泽西州靠近海边的地方扩建数据中心,就靠近过去发过洪水的地方。相关人员调查了近年来的洪水水位后,来确定建筑物的理想高度,所以就算真发洪水,也只是停车场进水,而不是数据中心进水。
Grogan说,除了通过加固数据中心来应对飓风,很少有数据中心从长远规划的角度来提出应对自然灾害的解决方案,例如将数据中心迁离灾害多发地点,或者兴建地理位置分散的冗余数据中心,或者选择第三方机构的灾难恢复和云计算解决方案。最后一种方式,受到了美国东北地区用户的青睐。 Cervalis公司有200多个大企业客户,其中包括跨国银行和软件及测试公司,公司在纽约北部地区、新泽西州帕萨伊克县和康涅狄格州费尔菲尔德县,拥有数十万平方英尺的多租户场地,这些地区都远离洪泛区。该公司充当了主数据中心或辅助数据中心的角色,提供安全有保障的机柜和冗余电源。Cervalis公司主管销售、营销和业务开发的副总裁Zack Margolis认为,对用户而言,采用Cervalis提供的服务,其成本低于自行兴建冗余数据中心的成本。
但并非所有企业都购置得起高级别的保护措施,一些小型企业会采用比较便宜的弹性机制来进行数据备份,比如安装在小型灾难恢复设施或虚拟化云端的备份磁带。
不过,仍旧有许多企业仍然固守位于现在位置的数据中心,例如众多金融机构建在纽约曼哈顿的数据中心。尽管可以通过各种高速连接的方式,来保证数据传输的低延迟,但是这些公司仍旧不想远离曼哈顿这样的交易活动中心,仍想要“近距离触摸它们的数据”。
风暴再来时该怎么办
Kumar认为,总的来说,极少有IT负责人对天气和气候变化的征兆引起足够的重视。大多数IT管理人员还是不愿积极主动地评估风险,以避免灾害。当桑迪这样的自然灾害再次降临时,数据中心的运营者们又该如何应对呢?
确保油箱和燃油泵安全 桑迪飓风期间,在曼哈顿市中心,大多数数据中心停运的原因是燃油泵油箱破裂以及电气线路短路。Datagram为Gawker、Buzzfeed等客户提供托管服务,当时涌入地下室的洪水导致柴油油箱破裂,致使燃油系统故障。Datagram首席执行官Alex Reppen认为,安装多只油箱,然后外面浇上水泥,也许能保证它在风暴潮期间不会受损。
检查应急线缆、软管、连接器和备用电路 Peer1 Hosting在全美建有21个数据中心。桑迪飓风来临的时候,公司临时组织的一队人曾通宵达旦地把燃料递送到屋顶的发电机,以便曼哈顿的一个数据中心能够正常运行。Peer1 Hosting的高级副总裁Ted Smith说:“我们遇到了散热问题,数据中心的某个部分因此一整天没法使用,原因是我们在停电期间无法顺利散热。所以我们得到的教训是:认真检查备用电源方案,检查UPS电池,并确保有足够的应急线缆、软管、连接器,以及长时间运行备用设备和发电机的燃油。”
地下室另辟蹊径 如果数据中心地下室大量进水,储存燃料的油箱可能会漂浮起来,其自身不一定会受损,但与油箱相连的管道和燃油泵可能会被损坏,Intermap公司在桑迪飓风期间就遇到了这样的问题。Internap公司的Steve Orchard说:“由于受到建筑物结构及历史原因的影响,油箱可能埋在地下,也可能就搁在地下室的支架上。如果是后者,一定要把油箱固定在钢架上,即便它浸泡在水中那样也不会漂浮。我们还在考虑把浸在水中的燃油泵装到油箱里面,以免受损。同时把另外一只冗余的燃油泵放在六英尺高的夹层上面,来确保燃油系统的安全性。
考虑三重电源备份 桑迪来临期间,位于纽约布鲁克林的CitiServ数据中心保持正常运行,处理了911和311急救服务。之所以能做到这样,一方面是因为CitiServ数据中心建在布鲁克林远离飓风洪水区的地方,另一方面是因为它采取了三重电源备份策略,其中包括市电、应急发电机和电池。在风暴最猛烈时期,整个发电机供电顺畅。在普通市电恢复之前,依托储有20万加仑柴油的油箱,整个发电系统为CitiServ数据中心所有系统提供了45个小时的电力供应。
使用沙袋 当桑迪飓风向QTS建在新泽西州泽西城的数据中心袭来时,险象环生。QTS的首席技术官Brian Johnston说:“我们受到了水位上升和大风的影响,洪水径直逼近到了我们建筑物的边缘。还好的是,除了电缆室和来自街道的线路外,数据中心的绝大部分位于建筑物的第16层到第20层,抗风暴的能力还比较强。而且,我们1000加仑容量油箱里面的燃油以及停车场里面的电动泵也能防水。而且风暴期间,工作人员用沙袋堵住了建筑物和停车中心的任何口子,洪水也没有涌入到停车场或电缆室。”
基于桑迪飓风期间的成功经验,Johnston表示,未来他们会使用更多的洪水阻拦装置,并对IT人员进行应急程序方面的培训。
2012年10月,桑迪飓风在美国新泽西州登陆,造成了巨大的人员、财产损失。其中就包括对当地一些数据中心带来了巨大影响,部分数据中心甚至业务一度中断。
桑迪飓风造成托管服务提供商Internap公司位于纽约市中心的数据中心严重进水,数据中心后备电力系统的燃油泵被迫关闭。当时,Internap不得不改用较高楼层另一只储有1200加仑燃油的储备油箱,才得以保证服务器在飓风期间正常运行。
近几年,卡特里娜飓风等一系列飓风给墨西哥湾沿岸地区造成了巨大的破坏,也给Entergy公司的数据中心带来了影响。Entergy公司是一家位于新奥尔良的电力公司,为280万户客户提供电力服务。
Entergy公司在路易斯安那州格雷特纳建有一个数据中心,毗邻密西西比河。Entergy公司的CIO Jill Israel说:“虽然在卡特里娜飓风期间,我们数据中心邻近地区没有被淹,但当时整个电力系统瘫痪,只能凭借备用发电机来提供电力。风暴过后,我们开始对数据中心的安全有所担忧,最后决定将整个数据中心搬迁。”
2006年冬天,Entergy公司决定在密西西比州杰克逊和阿肯色州小石城建造两个备用数据中心。在小石城,数据中心是利用一个旧图书馆返修而成,周围砌上了坚固的围墙。2008年之前,相应的关键应用从新奥尔良迁移到了这个备用数据中心。
2010年,Entergy公司又耗资3000万美元在密西西比州杰克逊建造了全新数据中心。Israel表示,公司在这两个数据中心之间对包括电子邮件系统在内的几个系统进行了负载均衡处理。“新的数据中心建成之后,我们又遇到了几次大风暴,包括小石城遭到的冰暴,但是我再也没有因为天气原因而担惊受怕了。”
Israel坦言,他们每年仍旧会针对飓风和风暴进行演练,以提高数据中心面对自然灾害时的响应能力。
不过,不是每家公司都能像Entergy公司这样保持如此高的警觉。众多欧洲和美国东北部的IT管理者仍旧认为超级风暴是小概率事件,是不会经常发生的不正常现象,不用太在意。甚至一些受到过大风暴影响的企业,管理人员在考虑IT优先事项时,会选择性地忘记气候变化,而不是像Israel那样保持警惕。
在曼哈顿市中心西街140号,Verizon的交换中心也曾经遭受了飓风桑迪的“蹂躏”,地下室以下五层,包括韦里逊的电缆室都进了水。飓风过后,Verizon用防风雨的光缆替换150吨重的已受损铜缆。Verizon企业解决方案公司全球客户服务保证部门副总裁Chris Kimm表示,通过更换电缆等基础设施,并搬到了较高楼层,各项服务得以在大概一周内恢复运行。
不过,尽管遭到了种种损坏,但Verizon没有考虑将其数据中心迁移到那些不常发洪水的地区。Kimm说:“我们对所有风险进行了再评估,对数据中心的基础设进行了加固。下一个飓风季节,将会考验这些应对措施的效果。”
长期规划应对灾害
气候变化对数据中心带来的影响很难估算。随着海平面和气温的上升,连气象学家也无法预测极端天气事件的发生。在美国一些地区,比如曼哈顿、长岛、新泽西州、迈阿密、弗吉尼亚海滩、波士顿、华盛顿、西雅图和圣迭戈,这种极端天气甚至有可能会有增无减。
鉴于“桑迪”飓风这样的自然灾害造成的可怕影响,人们不得不开始考虑,数据中心如何应对百年一遇、甚至千年一遇的恶劣气候带来的恶劣影响?面对这个问题,出现了两派声音。一方面,有人建议,数据中心只需加固现有的基础设施即可;另一方面,有人建议将数据中心搬到更安全的地方,例如地势较高的地方。
Internap主管开发和运营的高级副总裁Steve Orchard说:“没有人料到桑迪的破坏力会变得那么大。但加上前一年的飓风艾琳,我们看到气候趋势令人有点担忧。”
该公司已宣布正在新泽西州锡考克斯远离洪泛区的地方新建一个数据中心。Orchard说:“我们非常重视气候变化,气候变化确实是我们选择新址时所考虑的一个因素。”
调研机构451 Research公司的业务连续性和弹性专家Jim Grogan认为:“在数据中心建设中,有必要参考近期及中长期自然灾害的发生情况。每一起自然灾害都能带来相应经验教训,这些经验训练能够帮助数据中心运营者提高应对自然灾害的能力。”
新泽西州数据中心设计和咨询公司PTS数据中心解决方案公司的创始人兼总裁Peter Sacco认为,为什么美国东海岸大部分数据中心应对超级风暴的做法,只是加固现有的基础设施,其重要的一个原因是,“用户认为,现在计算机都是联网的,也就削弱了任何单一数据中心的重要性。大多数的数据中心负责人在数据中心选址时,大都会选择建设成本最低、投产最快的路子。”
Rakesh Kumar是Gartner公司的副总裁,专门研究数据中心和基础设施方面的问题。“各种自然灾害,例如寒冷气温、沿海洪水、海啸等不可知灾害事件,让以前被视为安全的地方现在也变得不安全了。不过,除非发生严重的数据停用事件,大多数的数据中心还是不会考虑气候变化带来的风险。”
有关调查发现,美国东海岸的公司大多没有主动地开展搬迁数据中心的计划。数据中心架构师Neil Sheehan表示,大多数公司选择了在同一地方进行扩建,根本没有迁址的想法。“例如我所在的公司,我们在为一些用户,在新泽西州靠近海边的地方扩建数据中心,就靠近过去发过洪水的地方。相关人员调查了近年来的洪水水位后,来确定建筑物的理想高度,所以就算真发洪水,也只是停车场进水,而不是数据中心进水。
Grogan说,除了通过加固数据中心来应对飓风,很少有数据中心从长远规划的角度来提出应对自然灾害的解决方案,例如将数据中心迁离灾害多发地点,或者兴建地理位置分散的冗余数据中心,或者选择第三方机构的灾难恢复和云计算解决方案。最后一种方式,受到了美国东北地区用户的青睐。 Cervalis公司有200多个大企业客户,其中包括跨国银行和软件及测试公司,公司在纽约北部地区、新泽西州帕萨伊克县和康涅狄格州费尔菲尔德县,拥有数十万平方英尺的多租户场地,这些地区都远离洪泛区。该公司充当了主数据中心或辅助数据中心的角色,提供安全有保障的机柜和冗余电源。Cervalis公司主管销售、营销和业务开发的副总裁Zack Margolis认为,对用户而言,采用Cervalis提供的服务,其成本低于自行兴建冗余数据中心的成本。
但并非所有企业都购置得起高级别的保护措施,一些小型企业会采用比较便宜的弹性机制来进行数据备份,比如安装在小型灾难恢复设施或虚拟化云端的备份磁带。
不过,仍旧有许多企业仍然固守位于现在位置的数据中心,例如众多金融机构建在纽约曼哈顿的数据中心。尽管可以通过各种高速连接的方式,来保证数据传输的低延迟,但是这些公司仍旧不想远离曼哈顿这样的交易活动中心,仍想要“近距离触摸它们的数据”。
风暴再来时该怎么办
Kumar认为,总的来说,极少有IT负责人对天气和气候变化的征兆引起足够的重视。大多数IT管理人员还是不愿积极主动地评估风险,以避免灾害。当桑迪这样的自然灾害再次降临时,数据中心的运营者们又该如何应对呢?
确保油箱和燃油泵安全 桑迪飓风期间,在曼哈顿市中心,大多数数据中心停运的原因是燃油泵油箱破裂以及电气线路短路。Datagram为Gawker、Buzzfeed等客户提供托管服务,当时涌入地下室的洪水导致柴油油箱破裂,致使燃油系统故障。Datagram首席执行官Alex Reppen认为,安装多只油箱,然后外面浇上水泥,也许能保证它在风暴潮期间不会受损。
检查应急线缆、软管、连接器和备用电路 Peer1 Hosting在全美建有21个数据中心。桑迪飓风来临的时候,公司临时组织的一队人曾通宵达旦地把燃料递送到屋顶的发电机,以便曼哈顿的一个数据中心能够正常运行。Peer1 Hosting的高级副总裁Ted Smith说:“我们遇到了散热问题,数据中心的某个部分因此一整天没法使用,原因是我们在停电期间无法顺利散热。所以我们得到的教训是:认真检查备用电源方案,检查UPS电池,并确保有足够的应急线缆、软管、连接器,以及长时间运行备用设备和发电机的燃油。”
地下室另辟蹊径 如果数据中心地下室大量进水,储存燃料的油箱可能会漂浮起来,其自身不一定会受损,但与油箱相连的管道和燃油泵可能会被损坏,Intermap公司在桑迪飓风期间就遇到了这样的问题。Internap公司的Steve Orchard说:“由于受到建筑物结构及历史原因的影响,油箱可能埋在地下,也可能就搁在地下室的支架上。如果是后者,一定要把油箱固定在钢架上,即便它浸泡在水中那样也不会漂浮。我们还在考虑把浸在水中的燃油泵装到油箱里面,以免受损。同时把另外一只冗余的燃油泵放在六英尺高的夹层上面,来确保燃油系统的安全性。
考虑三重电源备份 桑迪来临期间,位于纽约布鲁克林的CitiServ数据中心保持正常运行,处理了911和311急救服务。之所以能做到这样,一方面是因为CitiServ数据中心建在布鲁克林远离飓风洪水区的地方,另一方面是因为它采取了三重电源备份策略,其中包括市电、应急发电机和电池。在风暴最猛烈时期,整个发电机供电顺畅。在普通市电恢复之前,依托储有20万加仑柴油的油箱,整个发电系统为CitiServ数据中心所有系统提供了45个小时的电力供应。
使用沙袋 当桑迪飓风向QTS建在新泽西州泽西城的数据中心袭来时,险象环生。QTS的首席技术官Brian Johnston说:“我们受到了水位上升和大风的影响,洪水径直逼近到了我们建筑物的边缘。还好的是,除了电缆室和来自街道的线路外,数据中心的绝大部分位于建筑物的第16层到第20层,抗风暴的能力还比较强。而且,我们1000加仑容量油箱里面的燃油以及停车场里面的电动泵也能防水。而且风暴期间,工作人员用沙袋堵住了建筑物和停车中心的任何口子,洪水也没有涌入到停车场或电缆室。”
基于桑迪飓风期间的成功经验,Johnston表示,未来他们会使用更多的洪水阻拦装置,并对IT人员进行应急程序方面的培训。