En janvier 2020 on perd 50% de nos serveurs. Notre cluster RabbitMQ ? Mort ! Nos clusters Redis, ElasticSearch ? Morts. Nos frontaux ? Morts ! Les gateway ? Et ben non, celles-ci ne sont pas tombées, tiens…

3 semaines de rush intense plus tard, une décision est prise : ÇA N’ARRIVERA PLUS JAMAIS !

2 ans plus tard, voici les actions que nous avons menées pour avoir un plan de reprise d’activité efficace.

De la documentation, à l’automatisation, en passant par les workflows de travail, voici quelques idées pour que vous ne viviez pas ce que l’on a subi en 2020.

Comments

Please login to leave a comment

Xavier Lacot at 15:58 on 14 Oct 2022

Très didactique, raisonnable et intéressant. Plein de bon sens, merci !

Merci ! Très intéressant !

Stéphan at 15:59 on 14 Oct 2022

👍

Alexandre R at 16:00 on 14 Oct 2022

Bons conseils, merci

David P at 16:05 on 14 Oct 2022

Très bon retour d'expérience.
Très instructif

Un retour d’expérience d’une situation dramatique qui apporte tout un lot de bonnes pratiques à suivre !
Bravo !