1つの電源切り替えの失敗。 1億5000万ドルと3日間の混乱。

データセンターの電源設備が1台、正常に切り替わらず、デルタ航空のバックアップシステムも完全には補完できませんでした。その結果、実際の停電はわずか数時間で済んだにもかかわらず、約2,000便の欠航と数日間に及ぶ復旧作業を招きました。

デルタ航空データセンター障害のコスト デルタ航空2016年の欠航 航空会社のデータセンター障害 バックアップ電源障害のコスト事例
スクロールしてタイムラインを見る
2,300 3日間で欠航した便数
1億5000万ドル 税引前利益の減少額

1つの表でわかる、事の経緯。

出典は本文中にリンクしています。主にデルタ航空自身のSEC提出書類および投資家向け開示資料に基づいています。

日付 2016年8月8日、復旧作業は8月10日まで続きました。
何が起きたか デルタ航空のアトランタのデータセンターにある重要な電源制御機器が故障し、一部のシステムは設計通りにバックアップ電源へ切り替わりませんでした——データセンターがまさに防ぐために構築されている冗長性が、部分的に機能しなかったのです。
規模 この障害により、デルタ航空は3日間で約2,300便を欠航させることになり、根本的な電源問題は数時間で解決したにもかかわらず、世界中で乗客が足止めされました。
復旧のギャップ 電源スイッチという中核的な技術障害は、修復に数時間しかかかりませんでした。しかし、航空機や乗務員の配置を含む航空事業全体の復旧には数日を要し、物理的な業務復旧が技術的な根本原因の解決を桁違いに上回る場合があることを示しています。
報告されたコスト デルタ航空はSEC提出書類で、この障害と復旧作業により税引前利益が約1億5000万ドル減少したと開示しました。これは8月の直接的な収益への打撃と、翌四半期にまで及んだ追加の復旧コストに分かれています。

テストされていない冗長性は、冗長性とは言えない。

この事件は、このリストの中で「障害が解消された」ことと「事業が復旧した」ことの間のギャップを最も明確に示す例です。

01

バックアップ電源の信頼性は、直近のテストの質に左右される

フェイルオーバーシステムはまさにこのようなシナリオのために設計されていましたが、それでも完全には作動しませんでした——冗長性は、単に設置済みであることを確認するだけでなく、現実的な障害条件下でテストされる必要があることを思い起こさせます。

02

航空会社の業務復旧は、システム復旧よりも遅い

システムが復旧しても、航空機や乗務員はネットワーク全体でまだ本来の位置から外れたままでした——この連鎖的なスケジュールの力学こそが、航空会社の障害が、そのIT上の根本原因だけから想定されるよりも、時間あたりのコストで一貫して高くつく理由です。

03

短時間の障害でも9桁のコストになり得る

電源障害そのものは数時間で解決しましたが、総コストは1億5000万ドルに達しました——コストは、元の障害がどれだけ続いたかだけでなく、業務上の連鎖と復旧の複雑さに応じて拡大します。

デルタ航空2016についての質問。

この事件をデータセンターのレジリエンスや災害復旧の事例として引用する際によくある質問。

これはサイバー攻撃でしたか、それともハードウェア障害でしたか? ハードウェアおよび電源システムの障害です——デルタ航空は、外部からの攻撃ではなく、データセンターの電源インフラにおける機器の不具合が原因であるとしています。
数時間で済んだ電源問題の復旧に、なぜ3日もかかったのですか? 欠航・遅延した便により、デルタ航空のネットワーク全体で航空機と乗務員が本来の位置から外れてしまいました。そこから合法的かつ機能するスケジュールを再構築するには、基盤となるシステムを復旧させるよりもはるかに長い時間がかかります。
デルタ航空はその後インフラを変更しましたか? デルタ航空は、この事件を受けて、データセンターのレジリエンスとバックアップ電源のテストを見直し、強化することを公に約束しました。
これは計算ツールにどう対応しますか? 航空会社計算ツールは、この連鎖的な遅延の力学を直接モデル化しています——短いMTTR(平均修復時間)を入力しても、頻度と連鎖を考慮すると、依然として大きな年間コストが算出されます。

データセンター障害は、あなたの事業にいくらのコストをもたらすでしょうか?

同じ数式を使って、自社のシステム、収益、復旧時間をモデル化してください。

モード

アクセントカラー