更糟糕的是,同一个地区的其他可用区也出现了异常现象。
谷歌云的巴黎数据中心发生糟糕的“进水”事件过去两周后,受影响的设施依然处于宕机状态,没有迹象表明系统何时恢复正常运行。
4 月 25 日,谷歌云的 europe-west9 地区遭遇进水。
由于数据中心怕水,故障随之而来。
后来发现,进水问题对 europe-west9-a 可用区造成的破坏最严重,这是该地区三个可用区中的一个。
数据中心运营商 Global Switch 当时承认在谷歌云遇到问题的同时遭遇了一起事件。
4 月 26 日的一份声明声称:“今天早上,我们巴黎园区两个数据中心之一的一间机房发生了火灾。”
两天后,更新消息显示“我们巴黎园区两个数据中心之一的火灾很快就被扑灭了,被控制在一间机房内。数据中心一直保持正常运行,受到的影响非常小。”
但从那以后,谷歌云的 europe-west9-a 却一直处于宕机状态。
谷歌云没有对客户发布最新的建议,依然是这样的内容: 我们在当地的团队正在评估该集群的物理基础设施。 目前受影响的产品列表已加以更新。 对 Cloud Bigtable 造成的影响继续仅限于 europe-west90-a 。 对于其余产品,影响仅限于位于受影响数据中心的实例。 这些产品以前未受影响的实例会继续正常运行,不受任何影响。 目前,europe-west90-a 受影响的实例完全恢复的预计时间尚不确定。 我们预计这些资源会出现长时间的中断。
为什么迟迟没有恢复正常?关于这起事件的一则法国论坛帖子表明,不仅仅是一起火灾这么简单。
一篇帖子称,事故起因是冷却泵出现了故障,导致渗水,结果水渗漏到了电池室,从而引发失火。
面对电气火灾,就连消防员处理起来都要小心翼翼。这次失火散发出很多热量,以至于过了几个小时后才有可能试图灭火,这意味着扑灭火焰就需要好几个小时。
这类事故清理起来需要相当大的工作量。
更为糟糕的是,上周末谷歌云的 europe-west9-c 可用区出现了近 5 个小时的严重异常。据谷歌的状态报告显示,这一事件意味着“在 europe-west9-c 的谷歌云产品可能无法供客户正常使用。”