バックアップ電源の信頼性は、直近のテストの質に左右される
フェイルオーバーシステムはまさにこのようなシナリオのために設計されていましたが、それでも完全には作動しませんでした——冗長性は、単に設置済みであることを確認するだけでなく、現実的な障害条件下でテストされる必要があることを思い起こさせます。
データセンターの電源設備が1台、正常に切り替わらず、デルタ航空のバックアップシステムも完全には補完できませんでした。その結果、実際の停電はわずか数時間で済んだにもかかわらず、約2,000便の欠航と数日間に及ぶ復旧作業を招きました。
出典は本文中にリンクしています。主にデルタ航空自身のSEC提出書類および投資家向け開示資料に基づいています。
この事件は、このリストの中で「障害が解消された」ことと「事業が復旧した」ことの間のギャップを最も明確に示す例です。
フェイルオーバーシステムはまさにこのようなシナリオのために設計されていましたが、それでも完全には作動しませんでした——冗長性は、単に設置済みであることを確認するだけでなく、現実的な障害条件下でテストされる必要があることを思い起こさせます。
システムが復旧しても、航空機や乗務員はネットワーク全体でまだ本来の位置から外れたままでした——この連鎖的なスケジュールの力学こそが、航空会社の障害が、そのIT上の根本原因だけから想定されるよりも、時間あたりのコストで一貫して高くつく理由です。
電源障害そのものは数時間で解決しましたが、総コストは1億5000万ドルに達しました——コストは、元の障害がどれだけ続いたかだけでなく、業務上の連鎖と復旧の複雑さに応じて拡大します。
この事件をデータセンターのレジリエンスや災害復旧の事例として引用する際によくある質問。
モード
アクセントカラー