查看原文
其他

阿里云,敬畏每一行代码还是敬畏每一位用户?

Test Ninja 软件质量报道 2022-06-03

昨日,6月27日16:21 阿里云挂了,根据阿里云官方说明,是因为“工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这一功能在测试环境验证中并未发生问题,上线到自动化运维系统后,触发了一个未知代码bug。错误代码禁用了部分内部IP,导致部分产品访问链路不通。” 受影响范围包括阿里云官网控制台以及MQ、NAS、OSS等产品功能。 16:50 受影响的业务正在逐步恢复中;17:30 受影响的业务大部分已经恢复正常,故障时间50分钟,最长超过一个小时,损失过亿、阿里云可靠性一下子降到5个9之下,属于低可靠性,估计今年不少人的奖金泡汤了。


阿里云团队没有怨天怨地,没给自己找借口,也承认不该出现这样的失误!将认真复盘改进自动化运维技术和发布验证流程。这要要👍 

有意思的话出现了敬畏每一行代码,敬畏每一份托付”,为什么敬畏每一行代码?能理解它的含义,代码像大海、像中国股市,琢磨不定,代码可以带来业务的成功,也可以给业务带来灾难,是吗?但我们更应该敬畏质量,敬畏用户。代码,不应该像大海、像中国股市,要加强review、加强测试,服务于业务,服务于用户。至少我们应该看到阿里云对客户、用户的敬畏,对客户的承诺,承诺将来不犯这样的错误,如果犯了,如何赔偿客户...... 再者,“敬畏每一份托付”,是领导的托付、还是manager/Lead的托付?为什么不能清清楚楚写上“敬畏每一份客户的托付”?

不过,阿里云的客户不用担心,有人对钱没有兴趣,你们应该会得到足够的赔偿,甚至想赔多少,阿里可能就赔你多少 当然,作者说了不算。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存