您会定期听到有关事故调查的信息。当客机坠落,火车掉轨或任何其他严重事故时,将开始进行严峻的调查,以挽救死伤者。通常,调查机构一开始会做一个简报,然后几个月您什么都不会听到。很少有人知道调查人员在寻找什么。
这是因为调查人员可能需要花费数月的时间来仔细检查每个细节,然后才能确定造成事故的原因。进行详细的调查是因为很少有导致严重事故的单一原因。最终,调查将显示一系列事件的发生,并且如果其中任何一个事件发生了变化,都有可能避免事故的发生。
实际上,这种类型的调查是针对各种事故而发生的,而不仅仅是交通运输灾难。公司和监管机构对各种各样的计划外事件遵循类似的程序。实际上,当事故造成重大损失时,公司将启动此类调查,例如2月28日断电导致Amazon Web Services及其S3存储服务中断,这解释了公司为什么进行此项调查的原因。
我是在1971年春末亲眼观察这一情况的,当时我被送往弗吉尼亚州罗阿诺克附近的一座山上,掩盖了我刚开始工作的电视台的一次飞机失事。在那座山上,第二次世界大战的英雄和好莱坞演员奥迪·墨菲(Audie Murphy)等五人死亡,他们乘坐的飞机被雾笼罩在山顶上。
我和其他新闻工作人员一起爬上山坡时,周围有我来自国家运输安全委员会的代表,他们已经在拍照并测量了坠机现场。后来,他们将可以找到的所有零件从破碎的飞机上带到吊架上,以进行检查和进一步调查。
对我来说,正如我从那座山腰报告的那样,坠机的原因似乎很明显。飞行员一定迷路了,看不见那座山。但是事实比这复杂得多。
调查人员必须了解为什么飞行员在主要机场附近那样迷路了?天气转坏后,为什么他没有在附近的主要机场降落仪表?最终回答了这些问题,并最终吸取了教训。
幸运的是,并非每一次事故都会导致悲剧性死亡。但是,必须对每起严重事故进行调查,以了解如何发生以及如何防止再次发生。
2月28日事件就是这种情况,当时Amazon Web Service的S3存储服务关闭了几个小时。这次损失的损失不是生命,而是亚马逊和客户因停机造成的数百万美元损失。显然是在进行调查。
但是正如亚马逊在3月2日发布的报告中向其客户道歉所解释的那样,这是一系列事件,始于最小的错误,即服务器更新命令中的错字。