Uma tempestade de inverno revelou um sistema de escalas dos anos 90.

Uma única tempestade severa não deveria imobilizar uma companhia aérea durante dez dias. Na Southwest, ela expôs um sistema de escalas de tripulação incapaz de acompanhar o ritmo de uma reprogramação em massa — cancelando 16.700 voos e custando à companhia mais de 1,1 mil milhões de dólares.

custo do colapso da Southwest Airlines cancelamentos da Southwest nas festas de 2022 falha do sistema de escalas de companhias aéreas multa do DOT à Southwest
Deslize para ver a cronologia
16,7 mil voos cancelados em dez dias
1,1 mil M$+ reembolsos, compensações e vendas perdidas

O que aconteceu, numa tabela.

As fontes estão ligadas no texto; os valores são as estimativas públicas mais recentes disponíveis na última atualização desta página.

Data Final de dezembro de 2022, centrado entre 21 e 31 de dezembro, durante o pico de viagens das festas.
O que falhou Uma tempestade de inverno severa perturbou as operações nos centros de conexão da Southwest em Denver e Chicago, mas a interrupção que se seguiu foi autoinfligida: o software de escalas de tripulação da companhia, com décadas de existência, não conseguiu processar o volume de reatribuições necessário, deixando milhares de aeronaves sem uma tripulação designada e habilitada mesmo depois de o tempo ter melhorado.
Escala A Southwest cancelou aproximadamente 16.700 voos e deixou mais de 2 milhões de viajantes retidos durante cerca de dez dias — muito mais tempo do que a própria tempestade durou, e muito pior do que qualquer outra companhia aérea dos EUA que operou sob o mesmo clima.
Resultado regulatório O Departamento de Transportes dos EUA (DOT) concluiu que a Southwest tinha violado a lei de proteção ao consumidor — incluindo não ter prestado assistência aos passageiros retidos e ter uma linha de apoio ao cliente sobrecarregada — e multou a companhia em 140 milhões de dólares, incluindo uma multa civil de 35 milhões de dólares.
Custo reportado A Southwest reportou que o colapso lhe custou mais de 1,1 mil milhões de dólares em reembolsos, compensações, custos operacionais adicionais e vendas de bilhetes perdidas nos meses seguintes — além dos 140 milhões de dólares do acordo com o DOT.

A tempestade foi o gatilho. O sistema foi a falha.

Todas as companhias aéreas dos EUA voaram através da mesma tempestade de dezembro. Só uma precisou de dez dias e 1,1 mil milhões de dólares para se recuperar.

01

Os sistemas legados falham exatamente no pior momento

Um software de escalas de tripulação que funciona bem num dia normal pode colapsar por completo perante uma disrupção em massa — o modo de falha que realmente importa raramente é o caso médio, mas sim o evento extremo para o qual o sistema nunca foi testado sob carga.

02

As soluções manuais não escalam para esta dimensão

Os responsáveis por escalas de tripulação da Southwest recorreram, segundo relatos, a chamadas telefónicas e processos manuais para acompanhar a localização das tripulações — uma solução que funciona para um punhado de perturbações, mas colapsa quando são necessárias milhares de reatribuições em simultâneo.

03

A fatura regulatória chega depois da operacional

A multa de 140 milhões de dólares do DOT chegou um ano inteiro depois da própria interrupção — um lembrete de que as interrupções voltadas para o consumidor em setores regulados acarretam um segundo custo, atrasado, para além do impacto imediato nas receitas e na recuperação.

O colapso da Southwest, explicado.

Perguntas que surgem ao citar este incidente num caso de modernização de infraestrutura ou resiliência.

Isto foi realmente uma interrupção de TI? Não no sentido tradicional — o software não falhou de forma abrupta. Simplesmente não conseguiu suportar a carga operacional, o que é, por si só, uma categoria de falha diferente e possivelmente mais difícil de testar do que uma interrupção total.
Outras companhias aéreas tiveram o mesmo problema? Não — a American, a Delta e a United voaram através do mesmo sistema de tempestade com muito menos cancelamentos, o que é parte da razão pela qual reguladores e media trataram o colapso da Southwest como uma falha autoinfligida e específica da empresa, em vez de um evento meteorológico à escala de todo o setor.
O que fez a Southwest depois? A companhia comprometeu-se com um investimento plurianual na modernização dos seus sistemas de escalas de tripulação e operacionais, como parte da sua resposta e do acordo com o DOT.
Como é que isto se traduz na calculadora? Use a calculadora do setor aéreo para a dinâmica de atrasos em cascata, e note que o MTTR real deste incidente esteve mais próximo de dez dias do que do equivalente a um único atraso de voo.

Quanto lhe custaria uma falha operacional de vários dias?

Modele a sua própria frota, receita e frequência de incidentes usando a mesma fórmula.

Modo

Cor de destaque