微软为上周的Exchange Online服务中断道歉并承诺改善其程序

2019-12-16 10:55:40 来源: INeng财经

有关Exchange Online(Microsoft的基于云的企业电子邮件,日历和联系人管理平台)出现问题的更多详细信息,该网站在6月24日(星期二)遭受了长时间停机,使一些客户失去了他们最基本的沟通和协作方式之一。IT经理充斥了Office 365支持论坛,以寻求答案并发泄他们的挫败感,因为他们在办公室停工了几个小时。管理员用来在其云订阅上保留选项卡的Service Health Dashboard无法正确报告任何问题。

Microsoft在八个小时后恢复了该服务。但是,这种经验加上前一天Lync Online的中断,引起了人们对将关键业务服务迁移到云的担忧。

在重大服务中断之后,Office 365工程公司副总裁Rajesh Jha转向公司的支持论坛,以提供公司的建议。他写道:“首先,我要代表Office 365团队为此造成的影响和不便表示歉意。” 他补充说:“电子邮件和实时通信对您的业务至关重要,我和我的团队完全认识到我们作为您的合作伙伴和服务提供商所承担的责任和责任。”

Jha承认,客户用来监视其Microsoft云服务的工具不尽人意。他解释说,他的公司“在我们的服务运行状况仪表板(SHD)发布过程中也遇到了问题,这意味着并非所有受影响的客户都能及时得到通知,我们意识到这很令人沮丧,此问题已得到解决。”

Jha解释说,Exchange Online的麻烦是由“目录角色间歇性故障导致目录分区停止响应身份验证请求”引起的。“这导致一小部分客户失去了电子邮件访问权限。”

他声称损害是“只针对少数客户”,他说,缺陷的“独特性”导致恢复时间延长。该问题加剧了这一问题,并引发了“由于先前未知的代码缺陷导致更广泛的客户邮件流延迟,因此在更广泛的邮件传递系统中出现了意外问题”。

贾(Jha)表示,他的团队不仅解决了根本问题,而且还在更新其系统,以防止问题再次发生。他说:“除了解决根本原因触发因素外,我们还在努力对此模式进行进一步的强化。”

Lync Online的问题开始很小,然后迅速升级。贾哈表示,这项服务受到“由于外部网络故障,导致我们北美数据中心的客户端连接短暂中断”的消息。当问题在短短几分钟内解决后,“随之而来的流量激增导致多个网络元素过载”,使部分客户无法使用Lync数小时。

微软从这一经验中吸取了教训,并正在努力树立对其云服务的信心。贾哈说:“虽然我们已解决了问题的根本原因,但我们将从经验中汲取教训,并继续改进我们的主动监测,预防,恢复和纵深防御系统。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。