Les objectifs de restauration démystifiés

Les interruptions d’activité ne sont pas envisageables lorsque les entreprises s’engagent à répondre aux besoins et aux attentes de leurs clients. Différents types d’incident peuvent se produire et impacter votre chiffre d’affaires, voire remettre en question l’existence même de votre entreprise. Qu’il s’agisse d’une attaque de ransomware, d’une panne d’alimentation électrique, d’une inondation ou simplement d’une erreur humaine, ces événements sont imprévisibles. VOUS Y PRÉPARER est donc la meilleure solution.

Être prêt signifie disposer d’un solide plan de continuité d’activité et de reprise après incident (ou plan de BCDR). Et pour une mise en œuvre fluide, celui-ci devra avoir été préalablement testé.

Parmi les paramètres importants d’un plan de BCDR figurent le délai optimal de reprise d’activité (RPO) et l’objectif de temps de restauration (RTO). Si ces termes ne vous sont pas familiers, en voici une définition succincte :

  • Le RPO limite le retour en arrière dans le temps et définit la quantité maximale de données perdues admissible. Il se mesure en temps entre le moment de la défaillance et la dernière sauvegarde exempte de problème.
  • Le RTO concerne la durée d’interruption de l’activité. C’est le temps nécessaire pour rétablir la situation après un incident, jusqu’au retour à la normale pour les utilisateurs.
Demystifying Recovery Objectives

Bien que similaires en apparence, les abréviations RPO et RTO désignent des objectifs différents. Dans un monde idéal, leurs valeurs devraient être les plus proches possible de zéro. Toutefois, dans notre monde réel, il serait prohibitif, et probablement injustifié, de souhaiter des RPO et des RTO autour de zéro.

Examinons de plus près les objectifs de restauration. Le RPO correspond donc à la quantité de données que vous pouvez vous permettre de perdre avant que l’exploitation soit impactée. Dans le secteur bancaire, par exemple, une heure de données perdues peut être catastrophique puisque les transactions sont réalisées en temps réel. Faisons une analogie avec une situation individuelle : représentez-vous le RPO comme le moment où vous avez enregistré votre document de travail pour la dernière fois. Si votre ordinateur vous lâche et que vos dernières modifications sont perdues, à quelle quantité de travail êtes-vous prêt à renoncer avant d’en ressentir l’impact ?

De son côté, le RTO est la période pendant laquelle les applications et les systèmes doivent être restaurés après un incident. Il est recommandé de le mesurer à partir du moment où se produit la défaillance, plutôt qu’à compter de l’intervention de l’équipe informatique chargée de régler le problème. Plus réaliste, cette approche correspond à l’instant précis où les utilisateurs commencent à être impactés.

Comment définir les valeurs de RTO et de RPO pour vos applications

En réalité, il n’existe pas de solution universelle applicable au plan de continuité d’activité et à ses métriques. D’un secteur à l’autre, les besoins des entreprises sont distincts et cela se traduit par des objectifs de restauration différents. Il est néanmoins courant pour une entreprise de répartir les applications et les services entre différents « tiers » et de déterminer les valeurs de RTO et de RPO en fonction des contrats de niveau de service (SLA) sur lesquels elle s’est engagée.

Il est important de classifier la protection des données pour déterminer comment les stocker, y accéder, les protéger, les restaurer et les actualiser plus efficacement en fonction de critères spécifiques. Analyser les applications est essentiel pour savoir lesquelles font fonctionner l’activité, génèrent du chiffre d’affaires et doivent impérativement rester opérationnelles. Ce processus indispensable à tout plan de continuité d’activité qui se respecte est appelé analyse d’impact commercial (AIC). Il établit les protocoles et les actions nécessaires en cas de sinistre.

Par exemple, vous pouvez baser votre plan de continuité d’activité sur un modèle incluant trois tiers :

  • Tier-1 : applications critiques nécessitant un RPO et un RTO inférieurs à 15 minutes.
  • Tier-2 : applications métier stratégiques nécessitant un RPO de 2 heures et un RPO de 4 heures.
  • Tier-3 : applications non stratégiques nécessitant un RTO de 4 heures et un RPO de 24 heures.

Il est important de noter que le caractère critique ou stratégique des applications diffère selon le secteur d’activité et que chaque entreprise définit ces tiers en fonction de son fonctionnement et de ses exigences.

Une fois que vous avez classé vos applications et services, et que vous avez identifié l’impact qu’auraient des incidents spécifiques, il est temps de trouver la solution qui vous aidera à protéger les données et le fonctionnement de votre entreprise. La Veeam Platform réunit un ensemble complet d’outils conçus pour protéger les workloads virtuels, physiques et cloud en respectant les objectifs de restauration les plus stricts.

Comment fonctionnent les RTO et les RPO en pratique

Restauration rapide d’objets applicatifs

Un représentant commercial vient de supprimer l’e-mail qu’il devait envoyer sans attendre à un client. Microsoft Exchange est un exemple d’application tier-2. Comme l’administrateur IT planifie des tâches de sauvegarde tout au long de la journée, l’entreprise peut tout à fait respecter un RPO de 1 heure. Inclus dans toutes les versions de Veeam Backup & Replication, Veeam Explorer for Microsoft Exchange permet de restaurer très facilement un e-mail en quelques minutes — voire en quelques secondes. Vous réalisez ainsi un gain de temps et de ressources en évitant de restaurer la VM entière du serveur d’applications !

Demystifying Recovery Objectives

Restauration instantanée d’un serveur virtualisé entier directement depuis une sauvegarde

Prenons l’exemple d’une agence bancaire gérant plusieurs distributeurs automatiques. Le système qui régit ceux-ci est stratégique pour le fonctionnement de l’agence (tier-2), mais s’il tombait en panne pendant quelques heures, seules les transactions seraient impactées, pas l’intégrité de l’agence dans son ensemble. Grâce à Veeam Backup & Replication et à sa fonctionnalité de restauration instantanée de VM, le serveur virtualisé des distributeurs automatiques peut redémarrer automatiquement depuis un fichier de sauvegarde Veeam dédupliqué et compressé. Le résultat : un RTO de quelques minutes seulement ! Sans compter qu’avec les fonctionnalités de migration de l’hyperviseur et Veeam Quick Migration, vous pouvez facilement faire migrer la VM en cours d’exécution depuis le datastore de sauvegarde vers celui de production pour finaliser le processus de restauration.

Demystifying Recovery Objectives

Basculement de site complet

Nouveau scénario : des techniciens de maintenance provoquent une panne électrique dans l’un de vos datacenters, mettant un site complet à l’arrêt et empêchant l’accès à toutes vos applications tier-1. Imaginons que vous utilisiez Veeam pour répliquer toutes les 10 minutes la totalité de vos VM stratégiques hors site. Grâce à cette approche, vous pouvez respecter facilement un RPO de quelques minutes. Côté RTO, Veeam vous permet de rétablir facilement l’activité en cas d’incident grave, grâce à plusieurs fonctionnalités intégrées : basculement en un clic, retour arrière assisté, réadressage IP pour la mise en correspondance avec le réseau sur le site de DR et véritable reprise après incident basée sur le cloud.

Demystifying Recovery Objectives

Protection des terminaux

Quittons l’infrastructure virtuelle pour le monde physique : Veeam offre également des solutions de sauvegarde et de restauration pour les ordinateurs portables et fixes. Veeam Agent for Microsoft Windows permet de restaurer des fichiers depuis votre support de restauration vers votre ordinateur Windows, voire d’exploiter l’image de sauvegarde de celui-ci sur une VM pour obtenir un RPO restreint.

Demystifying Recovery Objectives

De plus, vous pouvez protéger vos workloads Linux avec Veeam Agent for Linux, qu’ils s’exécutent en local ou dans le cloud public.

Demystifying Recovery Objectives

Conclusion

Si personne ne peut prévoir un sinistre, il est possible d’agir de manière organisée en suivant un plan de continuité d’activité lorsque survient un incident. Les valeurs de RPO et de RTO peuvent varier d’une entreprise à l’autre, mais elles résulteront toujours d’un compromis entre les besoins de disponibilité de l’activité et les exigences en matière d’investissement IT. Leur estimation doivent être le résultat de délibérations entre les experts métier et IT de l’entreprise. Quoiqu’il en soit, au-delà des chiffres s’impose la mise en œuvre d’une solution de disponibilité fiable pour les workloads virtuels, physiques et cloud, capable d’assurer le maintien du fonctionnement de l’activité.


Pour aller plus loin :

NOUVELLE
V11

Limitez les pertes de données
Bloquez les ransomwares

#1 Backup and Recovery

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.