Los errores de OVHCloud durante el incendio de su data center

No, no se trata de «al caído, caerle», se trata, como siempre, de ser proactivos e inquisitivos, de reflexionar y aprender de las situaciones que suceden para, nosotros mismos, de evitar cometer estos mismos fallos. OVHCloud cometió varios errores durante e incendio de su centro de datos y, queremos destacarlos como un análisis independiente para tener en cuenta ante conflagraciones de este tipo.



Lo que sabemos

Las palabras se quedan cortas; los entendidos hablan de información que se remonta a diez años atrás donde los expertos habían señalado los riesgos que corría OVH en su centro de datos de Estrasburgo. Parece que a pesar de la rápida intervención de los bomberos, el edificio se perdió de antemano. A continuación, según nuestra investigación, 6 errores que habría cometido OVHcloud en el diseño y la protección física del datacenter, que han facilitado el desastre relacionado con el incendio que lo asoló. Esperando que el operador juegue la transparencia hasta el final y revele los resultados de las investigaciones que seguirán.

Hablamos aquí de la detección del fuego y su propagación, que disociamos de su origen. Parece seguro que se trata de un inversor en el que ha trabajado antes un técnico. Tanto el fabricante como el mantenedor son conocidos por los profesionales, aquí mantendremos sus nombres en silencio, especialmente porque aún no se ha revelado el mal funcionamiento. Estos errores son citados unánimemente por los actores del centro de datos de acuerdo con las noticias y entrevistas que han salido en los medios.

Error 1: los materiales

Como se menciona en la prensa, el comandante que encabezó la respuesta de los bomberos al incendio señaló la madera y los materiales plásticos presentes en el centro de datos. Se fabricó en parte con contenedores, pero estos containers están compuestos por una carcasa de acero y ¡un piso de madera!

Error 2: la energía almacenada en las salas de los servidores

El centro de datos siguió los conceptos OCP, según los enfoques iniciados por Facebook, de la corriente en distribución continua en los servidores, con una ruta ‘alterna’ y una ruta ‘continua’. En ese momento, OVH estaba demostrando innovación, pero rápidamente denunciada por los agentes del mercado. La energía se almacena aquí en baterías de plomo, que queman su energía bajo las llamas y que estaban ¡colocadas en las salas de servidores!

Error 3: La corriente de aire

La combustión se extendió en una corriente de aire, aprovechando el diseño de enfriamiento gratuito con circulación de aire de la parte inferior a la parte superior del centro de datos, lo que agravó el efecto de chimenea que propagó el fuego en los pisos.

Error 4: falta de detección temprana

Los centros de datos están equipados con sistemas de detección de incendios, en particular hoy en día la detección de los primeros humos, ¡el centro de datos aparentemente no estaba equipado con un sistema de detección temprana!

Error 5: la falta de extinción

Los países desarrollados exigen que los centros de datos tengan al menos sistemas de rociadores contra incendios. Al parecer los operarios del centro de datos de Estrasburgo, basaron su capacidad de respuesta de sus equipos en caso de un incidente, no tenían un sistema de extinción.

Error 6: falta de firewall

¿Qué es lo primero que se debe hacer en caso de incendio en un centro de datos? Cortar la energía. ¡El centro de datos no tenía firewall!

¿Por qué hacemos este análisis?

Porque en HostDime somos expertos en Centros de Datos y en este blog hacemos difusión de información relevante al respecto, así como estudios y proyecciones sobre los mismos. Estamos al servicio de la comunidad de data centers.

Si bien toda la comunidad de centros de datos expresamos nuestra solidaridad con OVHcloud y sus equipos, muchos pasaron el asombro comentando el evento y en ocasiones expresando sus críticas, pero en ‘off’. Sin embargo, esta información, a fuerza de ser compartida en secreto, finalmente surge y se hace pública. Para mantener su confianza, cumplimos con nuestra misión, que es no ocultar información, salvo que se estipule expresamente que es confidencial.

También queremos ir más allá en el servicio que brindamos, porque si OVHcloud es líder en la nube francesa -la ayuda anunciada por el Estado es la demostración de ello-, con el incendio en su datacenter y la revelación de los errores que que evocamos aquí y que acabará en la arena pública, las críticas no dejarán de reflejarse en todos los centros de datos del mundo y sus operadores.

El incendio en el centro de datos de OVHcloud en Estrasburgo fue el resultado de un incidente lamentable, junto con prácticas que no fueron llevadas a cabo por la gran mayoría de los actores, desde el diseño y la construcción hasta la operación, de los centros de datos en Francia. Quienes hoy, hemos tenido confirmación, deben responder a la pregunta de muchos de sus clientes: “ ¿Podría ocurrir el incendio de OVH en su centro de datos? “. Donde la respuesta es “no” porque por diseño y por inversión sus centros de datos están protegidos contra este riesgo. También pueden demostrarlo mediante la práctica actual y pública para sus clientes… ¡de análisis de riesgos! ¿No sería este el séptimo error de OVH?