6月27日,今天下午16: 21左右,阿里云官网部分功能以及MQ、NAS、OSS等产品部分功能访问异常。有用户反映,手机和PC都可以不要访问它。
然后阿里云工程师做了紧急处理。截至今天下午17: 30,阿里云官方宣布大部分受影响的产品功能已经恢复正常。
以下是阿里云官方回复的失败:
6月27日阿里云故障描述
6月27日下午,我们在运维中出现操作失误,导致部分客户访问阿里云官网控制台,使用部分有问题的产品功能,引起大佬吐槽。故障开始于北京时间2018年6月27日16: 21左右,16: 50开始恢复。
紧急技术恢复后,故障原因如下:
当天下午,工程师团队在线上的自动操作和更新功能中进行了更改验证操作。这个功能没在测试环境验证中没有任何问题。它上线自动运维系统后,触发了一个未知的代码bug。该代码禁用了一些内部IP,导致一些产品访问链接被阻止。在手动干预后,工程师团队很快找到了问题并将其恢复。
受影响的领域包括阿里云官网控制台、MQ、NAS、OSS等产品功能。这种失败是没有任何借口的。我们可以和不应该不要犯这样的错误!我们将认真审核和改进自动化运维技术和发布验证流程,尊重每一行代码和每一项委托。
阿里云计算有限公司
2018年6月27日
标签:功能产品阿里云