3月3日凌晨,阿里云出现宕机故障。受宕机故障影响,华北不少互联网公司APP、网站纷纷瘫痪,一大波程序员、运营和运维不得不从被窝里爬起来干活。在宕机故障发生大约1小时后,阿里云官方回应称,华北2地域可用区C部分ECS服务器等实例出现IO HANG,经紧急排查处理后逐步恢复。

虽然阿里云承诺尽快处理赔偿事宜,但阿里云并未公开详细的赔偿细节。不过,在阿里云开发者论坛上,曾有网友回复称,赔偿方案通常根据包年包月预付费模式和按量付费模式等有所不同,按每台故障时间的100倍赔偿,赔偿总额不超过支付的单台云服务器费用总额。

阿里云每次宕机都能引起轩然大波,据悉,目前中国有40%的网站都在阿里云上运营。根据市场调研机构IDC发布的市场份额报告显示,2018年阿里云市场份额占比45.5%,排名第一;腾讯云市场份额10.3%,排名第二;中国电信第三,份额7.6%。
有数据显示,中国目前有40%的网站部署在阿里云上。作为国内最大的公有云厂商,阿里云占据中国45%的云计算市场份额。说得更简单,阿里云一出现问题,简直波及一大批企业。

云服务发展到现在,随着市场规模的扩大,云计算的技术和云服务的模式也都趋成熟,但公有云服务的故障却仍然没有停止过。在过去不久的2018年,全球主流云计算厂商发生的大规模宕机事件不下数十起,个别厂商一年内甚至还出现了多次宕机故障。故障原因多种多样,亚马逊AWS称因数据中心硬件问题,微软Azure数据中心则因高温和打雷,腾讯云因运营和硬盘故障,谷歌则因自动化失效。

但与此同时,多家云服务商仍在承诺99.99%的安全可靠性。对此,有技术专家表示,这一数字是经过验证的,而且通过部署反馈,故障率的确在0.01%以下。并且,一旦出现故障,云服务商也都有相应的容灾方案,可以及时解决问题。

如今越来越多的公司,选择将自己的服务器迁到云服务供应商上。而全球绝大部分云服务市场,都被这几大主流云供应商占据,一旦云服务出现宕机,不仅影响到企业的生存,同时也会对用户体验造成破坏。总之一句,安全无小事。