阿里云突发严重故障,淘宝、闲鱼、阿里云盘、钉钉“崩”上热搜!历经 2.5 小时恢复

百家 作者:InfoQ 2023-11-13 14:58:00

作者 | 蔡芳芳

11 月 12 日下午,陆续有网友表示阿里旗下多款产品出现访问故障,随后【阿里云全线产品崩了】登上微博实时热搜。

据阿里云健康状态页(https://status.aliyun.com/#/)公告信息,本次故障为阿里云云产品控制台服务异常, 开始于 2023-11-12 17:44。

阿里云全线产品均受影响,包括:


企业级分布式应用服务、消息队列 MQ、微服务引擎、链路追踪、应用高可用服务、应用实时监控服务、Prometheus 监控服务、消息服务、消息队列 Kafka 版、机器学习、图像搜索、智能推荐 AIRec、智能开放搜索 OpenSearch、云行情、数据总线 DataHub、检索分析服务 Elasticsearch 版、图计算服务 Graph Compute、实时计算 Flink 版、智能数据建设与治理 Dataphin、开源大数据平台 E-MapReduce、云原生大数据计算服务 MaxCompute、实时数仓 Hologres、大数据开发治理平台 DataWorks、智能媒体服务、媒体处理、视频点播、对象存储、文件存储 NAS、表格存储、日志服务、云存储网关、文件存储 HDFS 版、块存储、混合云备份服务、密钥管理服务、云防火墙、数据库审计、加密服务、运维安全中心(堡垒机)、容器镜像服务、容器服务 Kubernetes 版、API 网关、资源编排、云原生数据仓库 AnalyticDB PostgreSQL 版、图数据库、云原生内存数据库 Tair、云数据库 Redis 版、云原生关系型数据库 PolarDB、云数据库专属集群、云数据库 MySQL 版、云原生数据仓库 AnalyticDB MySQL 版、云原生分布式数据库 PolarDB-X、云数据库 ClickHouse、云原生多模数据库 Lindorm、云数据库 PostgreSQL 版、云数据库 SQL Server 版、云数据库 MongoDB 版、云数据库 HBase 版、数据传输、数据库自治服务、数据库备份、物联网平台、NAT 网关、负载均衡、云解析 PrivateZone、弹性公网 IP、共享带宽、转发路由器、私网连接、高速通道、IPv6 网关、专有网络 VPC、云企业网、VPN 网关、FPGA 云服务器、超级计算集群、批量计算、无影云桌面、弹性伸缩、弹性容器实例、弹性裸金属服务器、云服务器 ECS、轻量应用服务器、函数计算、Serverless 应用引擎、云托付、专有宿主机、GPU 云服务器、弹性高性能计算、操作审计、服务器迁移中心、运维编排、智能计算灵骏、云呼叫中心、交通云控平台、客服工作台、视觉智能开放平台、智能外呼机器人、智能语音交互、智能对话机器人、智能用户增长、运维事件中心、新零售智能助理、智能双录质检、地址标准化、机器翻译、自然语言处理、短信服务、云解析 DNS、域名、号码认证服务、邮件推送、版权与专利服务、语音服务、智能联络中心、工商财税、Salesforce on Alibaba Cloud、智能营销引擎、云采销、能耗宝、阿里邮箱、商标服务、移动研发平台、机器人流程自动化、号码隐私保护、DataV 数据可视化、音视频通信、视频直播、闪电立方、网盘与相册服务、安全、内容安全、安全管家、应用身份服务 (IDaaS)、实人认证、数字证书管理服务(原 SSL 证书)、风险识别、Web 应用防火墙、云安全中心(态势感知)、数据管理、云价签、云投屏、物联网智能视频服务、物联网无线连接服务、CDN、云数据传输、数据语音、智能接入网关、全站加速、ChatAPP 消息、全球加速、安全加速 SCDN、边缘节点服务 ENS、访问控制、资源管理、云监控、配置审计。

同时本次故障并非某一可用区的故障,而是全球大故障。受影响地域包括:


华北 2(北京)、华北 6(乌兰察布)、华北 1(青岛)、华东 2(上海)、华南 2(河源)、华北 3(张家口)、中国香港、印度(孟买)、美国(硅谷)、华南 1(深圳)、英国(伦敦)、韩国(首尔)、日本(东京)、阿联酋(迪拜)、西南 1(成都)、华南 3(广州)、新加坡、澳大利亚(悉尼)、马来西亚(吉隆坡)、华北 5(呼和浩特)、印度尼西亚(雅加达)、美国(弗吉尼亚)、菲律宾(马尼拉)、泰国(曼谷)、华东 1(杭州)、华南 1 金融云、华东 5(南京 - 本地地域)、华东 6(福州 - 本地地域)、华北 2 金融云(邀测)、华东 2 金融云、华东 1 金融云、华北 2 阿里政务云 1、非区域性、德国(法兰克福)、沙特(利雅得 - 合作伙伴运营)

截至发稿时,阿里云健康状态页显示所有地域、所有服务均已恢复正常运行。2023-11-12 21:11,阿里云在的最新公告中称,受影响云产品均已恢复,因故障影响部分云产品的数据(如监控、账单等)可能存在延迟推送情况,不影响业务运行。

阿里云关于此次故障事件的处理公告

关于此次故障的具体原因分析后续处理,阿里云暂未披露,InfoQ 将持续跟进报道。

相关文章推荐:

《B 站宕机事故复盘:2021.07.13 我们是这样崩的》

《2022 年了,怎样才能做到真正的“永不宕机”?》(https://www.infoq.cn/article/R00J8cKSQ5ak3vizZhEm)

《这十个事件,让“永不宕机”变成了一个笑话》(https://www.infoq.cn/article/9Hl5ga2xNEz8ibwdxZZd?utm_campaign)

《2018 年十大云宕机事故盘点:主流无一幸免!》(https://www.infoq.cn/article/4pSNXHT4PuI4T\*L8g1Sk?utm_campaign)

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐
仅凭 7 页 PPT 拿下 1 亿美元融资、半年后估值超 10 亿!“欧洲 OpenAI”杀疯了
易鲸捷否认贴牌 Oracle;鸿蒙进教材:“纯血”版不再兼容安卓应用;大叔们遭AI女友“断崖式分手” | Q 资讯
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
被时代选中的智谱 AI:成为 OpenAI,超越 OpenAI

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接