Un certain vent de panique a soufflé ces dernières semaines dans de nombreuses entreprises dont les sites web ont été affectés par l’incendie du leader français du cloud et de l’hébergement de sites internet. Cet incident (qualifié de drame pour certains qui ont perdu toutes leurs données) a permis de mettre un coup de projecteur sur l’indispensable notion de PRA – le Plan de Reprise d’Activité – ou DRP Disaster Recovery Plan.

A chacun son PRA

Il existe plusieurs dizaines de façons de gérer une reprise d’activité en cas d’évènement grave mais il appartient à chacun de faire son étude de risques et de créer son PCA – Plan de Continuité d’Activité – en fonction de l’objectif et des moyens qu’on lui accorde.

Plus une entreprise cherchera à atteindre une absence de panne plus cela lui coûtera cher. Par exemple, une répartition du trafic sur plusieurs data centers en IP anycast avec une réplication à chaud des données peut permettre de faire du 24h/24h 7j/7j mais pour un budget onéreux.

Si une entreprise autorise une interruption de service, c’est alors la durée de cette dernière qui va déterminer le coût. Elle doit être rapportée à la perte d’exploitation en revenu de la société.

Six bonnes interrogations

C’est dans cette optique que notre SVP Engineer, Frederic Mas, a établi la check list suivante des questions à se poser lors de la mise en place d’un PRA :

  • L’audit interne : Il faut tout d’abord faire un audit de l’ensemble des pôles numériques de votre société : les sites internet, e-commerce, l’outil de messagerie, les logiciels utilisés pour la comptabilité, pour les messageries instantanées, les dossiers partagées etc…
  • Les prestataires : Il faut ensuite vérifier les prestataires avec lesquels votre société travaille : ont-ils un SLA (Service Level Agreement) ? Est-ce que ce dernier est en accord avec votre politique et vos besoins ? C’est un point à ne pas négliger : on ne s’engage pas à 99.8% de disponibilité pour ses services quand on est chez un hébergeur qui s’engage à 99.5%.
  • Les sauvegardes : Il convient de penser à vos sauvegardes. Sont-elles externalisées ou internalisées seulement (signe de grand danger) ? Sauvegardez-vous les données, mais aussi les codes sources ou encore les configurations particulières ?
  • Les tests : Avez-vous déjà fait l’exercice de restaurer votre production ailleurs ? Le faites-vous régulièrement ? N’oubliez-pas que le jour où vous devrez activer votre plan de secours, ce sera forcément sous une pression énorme et parce qu’il n’y aura pas d’autres solutions. Le diable est dans les détails surtout quand on agit sous la pression.
  • La résilience des applications : Vos applications sont-elles résilientes (réseau, ram, cpu, stockage, électricité …) ? Si une partie est endommagée, quelles sont les conséquences ? Comment assurer de la haute disponibilité ?
  • Votre hébergeur : Etes-vous agnostique à l’hébergeur ? Si vous devez changer d’hébergeur rapidement quelles sont les solutions qui s’offrent à vous ? Il est important de réfléchir et d’anticiper si vous voulez garantir la continuité de vos services.