Un archivo sin copiar. 440 millones de dólares en 45 minutos.

El script de despliegue de un creador de mercado se saltó uno de ocho servidores. Ese servidor todavía tenía código de prueba de ocho años de antigüedad inactivo — y una bandera reutilizada lo despertó, enviando una avalancha de operaciones descontroladas que estuvo a punto de acabar con la empresa antes del mediodía.

fallo de trading de Knight Capital pérdida de 440 millones de dólares de Knight Capital fallo de trading algorítmico ejemplo de costo por un despliegue defectuoso
Desplácese para ver la cronología
45 min Desde la apertura del mercado hasta la suspensión del trading
440 M$ Pérdida — casi la totalidad de la capitalización bursátil de la empresa

Lo que ocurrió, en una tabla.

Las fuentes están enlazadas en el texto; este incidente está documentado de forma inusualmente completa gracias a la investigación posterior de la SEC y su orden pública.

Fecha 1 de agosto de 2012, desde la apertura del mercado a las 9:30 a. m., hora del Este.
Qué falló Un técnico que desplegaba nuevo código de enrutamiento de órdenes olvidó copiarlo en uno de los ocho servidores de producción de Knight. Ese servidor todavía conservaba una función de prueba antigua y sin uso llamada "Power Peg", y una bandera reutilizada por el nuevo código la reactivó accidentalmente, enviando al mercado una avalancha de órdenes de compra y venta no intencionadas.
Escala En aproximadamente 45 minutos, el sistema de Knight envió más de 4 millones de órdenes mientras intentaba procesar solo 212 órdenes legítimas de clientes, negociando alrededor de 397 millones de acciones en aproximadamente 154 valores y acumulando grandes posiciones no deseadas.
Detección y detención Los ingenieros de Knight tardaron casi 45 minutos en diagnosticar el comportamiento errático del trading antes de apagar el sistema; no existía ningún disyuntor automático ni interruptor de emergencia que pudiera detener por sí solo el proceso específico que estaba fallando.
Costo reportado Knight Capital reveló una pérdida de trading de 440 millones de dólares, superior a las ganancias combinadas de la empresa de los varios años anteriores. La pérdida prácticamente eliminó su capitalización bursátil, obligando a una ronda de capital de emergencia, y en cuestión de meses Knight fue adquirida por su competidor Getco en una operación de rescate.

Sin plan de reversión, sin interruptor de emergencia.

Esta es la pérdida más rápida y concentrada de esta lista, un recordatorio de que la velocidad de detección importa más que casi cualquier otra cosa en los sistemas automatizados.

01

El código muerto no es un código inofensivo

La función Power Peg llevaba años sin usarse, pero nunca se eliminó; una bandera reutilizada en otra parte del código bastó para despertarla. Las rutas de código obsoletas conllevan un riesgo latente mientras sigan existiendo.

02

Los despliegues parciales son peores que no desplegar nada

Siete de los ocho servidores recibieron la actualización correcta; el octavo no. Un proceso de despliegue sin verificación automatizada de que cada nodo coincide con el estado previsto puede dejar un sistema en peor condición que antes del cambio.

03

El tiempo de detección es aquí todo el costo

Cada minuto que el sistema siguió funcionando aumentó las pérdidas a un ritmo que pocos otros incidentes de esta lista pueden igualar; en el trading automatizado, un interruptor de emergencia rápido y automático vale más que casi cualquier otra inversión individual en fiabilidad.

Knight Capital, explicado.

Preguntas que surgen al citar este incidente en un caso de seguridad de despliegues o infraestructura de trading.

¿Fue esto un hackeo o un intento de manipulación del mercado? No: los reguladores y la propia Knight lo atribuyeron a un error interno de despliegue, no a ningún ataque externo ni manipulación intencionada.
¿Se recuperó Knight Capital? No de forma independiente: la empresa sobrevivió solo gracias a una inyección de capital de emergencia por parte de inversores, y fue adquirida por Getco en cuestión de meses, pasando después a formar parte de KCG Holdings.
¿Qué cambió después en la industria? El incidente se convirtió en un caso ampliamente citado sobre la importancia de las listas de verificación previas al despliegue, los lanzamientos canary y los disyuntores automáticos en cualquier sistema capaz de tomar acciones financieras sin revisión humana.
¿Cómo se traduciría esto a la calculadora? Vea la calculadora de broker-dealer, que modela exactamente este tipo de riesgo de infraestructura de trading de baja frecuencia y alta severidad con un objetivo de MTTR corto.

¿Cuánto le costarían 45 minutos de automatización descontrolada?

Modele sus propios sistemas de trading, exposición de ingresos y tiempo de recuperación usando la misma fórmula.

Modo

Acento