受影响的产品包括云原生数据仓库AnalyticDB PostgreSQL版本、图数据库、云原生内存数据库Tair、云数据库Redis版本、云原生关系数据库PolarDB、云数据库专用集群、云数据库MySQL版本、云原生数据仓库AnalyticDB MySQL版本、云原生分布式数据库PolarDB-X、云数据库ClickHouse、云原生多模式数据库Lindorm、云数据库PostgreSQL版本、云数据库SQL Server版本、云数据库MongoDB版本、云数据库HBase版本、数据库自治服务、数据库备份。
受影响地区包括华北2(北京)、华东2(上海)、华东1(杭州)、华南1(深圳)、华北1(青岛)、中国香港、美国(硅谷) )和美国(弗吉尼亚州)。
值得注意的是,这已经是本月阿里云控制台服务第二次出现异常。 第一个例外是双11后一天(11月12日),涉及阿里云盘、淘宝、闲鱼、钉钉。 、语雀等产品,时长约为3.5小时。
当时,该消息在网络上迅速发酵,引发外界热议,相关话题也登上热搜。 对此,有网友表示,这是屏幕跳转次数过多造成的后遗症。 双11支撑了如此庞大的业务系统。 系统崩溃是正常的,不崩溃就是不正常的。
值得注意的是,除了C端产品外,公司的B端客户也受到了较大影响。 有媒体指出,影响范围之大,在阿里巴巴家族历史上是罕见的。 受影响地区包括中国大陆、中国香港,以及印度、美国、英国、韩国和日本等多个国家和地区。 天眼查数据显示,阿里云拥有超过300万企业用户。 对于这些客户来说,业务运营可能会因为云服务不可用而完全瘫痪。
作为上述产品和企业背后的云服务商,阿里云也发布后续公告称,当日(11月12日)17时44分开始,阿里云监控发现云产品控制台访问和API调用出现异常,阿里云工程师正在紧急排查中。 目前,工程师正在批量重启组件服务,大部分地区控制台服务已恢复。
据阿里巴巴方面消息,19时20分左右(11月12日),经过工程师紧急处理,阿里巴巴旗下淘宝、钉钉、阿里云等App已全面恢复。 随后至21时11分,所有受影响的云产品均已恢复。 由于故障,部分云产品的数据推送可能会出现延迟,不影响业务的正常运行。
此外,阿里云近年来多次出现服务异常的情况。
2018年6月,阿里云遭遇重大技术故障,持续近半小时。 当时,阿里云官方解释称:“我们运维中出现操作失误,导致部分客户访问阿里云官网控制台、使用部分产品功能出现问题。”
据新京报报道,2019年3月3日凌晨,有网友在微博上表示,阿里云疑似出现宕机。 这也影响到了华北地区不少互联网企业,所有应用程序和网站瘫痪。 对此,阿里云表示,将在紧急排查处理后逐步恢复服务。 针对本次故障,阿里云将根据SLA协议(服务合同)尽快处理赔偿事宜。
2022年12月18日,阿里云香港区可用区C再次出现大面积服务中断,导致多个香港、澳门站点受到影响。 阿里云官方也承认了这一点:“这对很多客户的业务造成了重大影响,也是阿里云运营十多年来持续时间最长的大规模故障。”
截至目前,五年内已发生三起重大事故。 阿里云还没来得及喘口气,就面临着整个系统的闪崩。 相关商业事故的发生频率也从五年内的三倍增加到六年内的五倍。