DRaaS, une solution de PRA dans le Cloud

Le développement continu du Cloud public permet le développement de nouvelles solutions de secours appelées Disaster Recovery as a Service (DRaaS) ou Plan de Reprise d'Activité as a Service (PRAaaS) en français.

Ces solutions DRaaS exploitent les principaux avantages du Cloud : élasticité, paiement à l'usage et entraînent donc des diminutions des coûts liés aux tailles des infrastructures.

Les récentes études réalisées par le Gartner, Forrester Consulting et Aberdeen Group, montrent toutes un fort engouement des DSI pour ces technologies DRaaS. Ainsi, suivant Forrester Consulting, plus de la moitié des entreprises américaines (59 %) a, soit un projet de mise en œuvre de DRaaS, soit est intéressée par la sujet.

Le PRA dans le Cloud se développe maintenant depuis 4/5 ans, essentiellement aux USA, mais également en France comme une alternative séduisante aux solutions classiques de PRA (soit en interne, soit via des hébergeurs spécialisés).

La société française Nuabee a développé une solution de Plan de Reprise d'Activité Informatique as a Service accessible aux PME et ETI, qui exploite les avantages du Cloud public.

Comment le DRaaS (ou PRA as a Service) fonctionne-t-il ?

Schématiquement, le DRaaS utilise plusieurs principes :

  • Une architecture Cloud en modèle IaaS qui contient l’espace de secours : indispensable pour permettre le redémarrage automatisé et rapide de l’infrastructure de secours
  • Une solution de réplication de données
  • Une console de PRA qui permet d’avoir l’accès aux différentes ressources.

Les différents modèles de DRaaS (PRA as a service)

Il existe schématiquement trois modèles de PRA as a Service :

  • Le mode en self-service  : l'entreprise choisit un fournisseur de solution de PRA Cloud, il intègre les différentes briques nécessaires et les administre. En cas de sinistre (et pendant les tests), ce sont les équipes du Client qui exécutent les procédures de reprise. 
  • Le mode partiellement managé (ou mode assisté) : le fournisseur de solution de PRA aide le Client à la mise en oeuvre du Plan de Reprise d'activité
  • Le modèle service managé : c'est un tiers (prestataire spécialisé) qui offre une solution complète et administrée en ayant intégré les composants dans un Cloud et en offrant une garantie de reprise. Le prestataire gère la mise en oeuvre du PRA, les tests réguliers, la reconnexion des utilisateurs à l'espace de secours et le Maintien en Conditions Opérationnelles du PRA.
  Mode Self-Service Partiellement Managé Totalement Managé
Déploiement du service de PRA Client Client avec support du prestataire Prestataire
Monitoring des réplications des données vers le Cloud (et mise à jour des politiques de réplication) Client Client Prestataire
Correction des erreurs (réplications des données, ressources indisponibles …) Client Client avec support du prestataire Prestataire
Adaptation du PRA à l’évolution du périmètre IT du Client Client Client avec support du prestataire Prestataire avec des informations venant du Client
Relancement de l’infrastructure de secours pour les tests fonctionnels du PRA Client Client avec support du prestataire Prestataire
Cible en termes d'entreprises  Grands Comptes  ETI avec équipes IT dédiées PRA ETI et PME qui n'ont pas de ressources IT dédiées PRA

 

Les avantages du PRA as a service

L'idée est d'utiliser la simplicité du Cloud et son modèle économique pour offrir une solution de secours informatique. Les points majeurs de cette approche sont ceux que l'on retrouve globalement dans le Cloud : Avantages-draas

  • Modèle économique : paiement à la consommation de l'espace disque répliqué et au nombre de serveurs à protéger mais pas de coût relatif aux VM inactives.
  • Elasticité de la démarche : possibilité d'étendre et de réduire le périmètre (et le coût) du PRA en « quelques clics » pour s'adapter à l'évolution de votre SI.
  • Mutualisation des ressources : adaptée à des délais de redémarrage en quelques heures grâce aux techniques de virtualisation

Un PRA as a Service doit s'inscrire dans une démarche continue de sauvegarde, de tests de restauration et de mise à jour du périmètre du PRA.

Les principales limites des solutions DRaaS (PRA as a service)

Elle sont principalement : 

  • Le choix des OS couverts : ainsi, si les architectures X86, Windows et Linux sont évidemment couvertes, les solutions permettant de couvrir des OS de mainframe (Z series, ...), UNIX propriétaires (AIX, HP/UX ...) ou OS/400 sont plus limitées.
  • Le besoin de débit télécom qui peut être très important suivant les solutions de réplication des données utilisées. 

PRA dans le Cloud : les différentes approches

Plan de Reprise d'Activité dans le Cloud (PRA cloud) : les différentes solutions

Un entreprise peut-elle aujourd'hui envisager un système d'information sans plan de reprise d'activité en cas de sinistre ou d'incident grave ? Cela devient de plus en plus improbable en regard de la criticité des applications métier.

Ainsi la notion de Plan de Reprise d'Activité dans le Cloud génère pas mal de buzz, et non sans raison : c'est une approche novatrice, convaincante et financièrement attractive permettant une récupération rapide du SI. Cependant, ce battage médiatique génère une confusion sur ce que recouvre le PRA dans le cloud.

La caractéristique essentielle de tout PRA dans le cloud, c'est la capacité à redémarrer tout ou partie du système d'information à partir de l'infrastructure hébergée chez un prestataire du Cloud.

Les différents modèles de Plan de Reprise d'Activité dans le Cloud

Le terme PRA dans le cloud recouvre des solutions différentes que l'on peut répartir en trois catégories:

Le modèle DRaaS (que l'on pourrait traduire comme PRA as a Service) :
Il s'agit d'offres industrialisées par des prestataires (comme la solution de PRA Cloud de Nuabee, Zetta, Zerto Virtual Replication, ..)  qui fournissent des services de bascule vers un environnement de cloud computing :

  • Les données sont envoyées dans le cloud soit par des mécanismes de réplication asynchrone (de type Veeam, Double Take ou Arcserve UDP HA) ou par des mécanismes de sauvegardes. Evidemment le choix d'une solution ou l'autre aura des impacts sur le RPO (fraicheur des données lors du redémarrage) et la taille des tuyaux nécessaires. Les RTO sont souvent dans ces solutions d'environ 1 à 4 heures avec des RPO qui vont de 15mn à une journée.
  • Le principe est évidemment basé sur le paiement à l'usage qui est le principe même du cloud avec néanmoins des différences importantes suivant les prestataires. La facturation est surtout liée à la volumétrie de stockage nécessaire, le nombre de VM nécessaire pour le redémarrage (elles doivent être réservées), les VM actives pour faire fonctionner la réplication ou la sauvegarde (les VM inactives ne sont pas facturées).

Le modèle « fait maison » :

il s'agit dans ce cas d'utiliser l'infrastructure de Cloud (public ou privé) d'un ou plusieurs fournisseurs pour construire un PRA. Mais c'est à vous de monter l'ensemble des briques pour faire fonctionner le PRA et de les administrer.

La reprise après sinistre d'un Cloud vers un Cloud (Cloud-to-Cloud Recovery) :

En fait il y existe 2 cas différents :

  • Soit il s'agit pour un même prestataire, d'offrir lui-même une solution de PRA avec réplication des données (et dans ce cas on parle de secours de secours) : à ce jour de nombreux prestataires de Cloud offrent ce service, qui a évidemment un coût.
  • Soit il s'agit de la capacité de redémarrer les infrastructures d'un cloud vers un autre cloud, que ce soit dans l'environnement d'un fournisseur unique ou à travers de multiples fournisseurs.

Les risques de confusion

Enfin il ne faut pas confondre le PRA dans le Cloud avec

  1. La sauvegarde de vos données dans le Cloud, car dans ce dernier cas vous devez trouver une infrastructure pour redémarrer votre SI, seules vos données sont externalisées dans le Cloud.
  2. La haute disponibilité dans le Cloud, qui est l'utilisation d'un cloud en mode actif/actif en complément de votre propre infrastructure avec redémarrage en quelques minutes ou dizaines de minutes. Dans ce contexte, l'ensemble de vos VM sont actives dans le cloud et sont donc facturées (et l'intérêt financier est limité).

L'élaboration d'un Plan de Continuité d'Activité

Une approche de la Gestion de la Continuité d'Activité dans une organisation peut (d’autres approches sont possibles) consister simplement à travailler successivement sur les deux axes principaux suivants :

  • identifier les impacts potentiels qui menacent une organisation,
  • déterminer des stratégies pour construire :
    • une capacité d’adaptation face aux menaces,
    • et une capacité de réponse efficace,

afin de protéger ce qui concourt à créer de la valeur pour l’organisation.

Les 4 étapes de la Gestion de la Continuité d'Activité

Suivant cette approche, la Gestion de la Continuité d'Activité est un processus cyclique qui s’appuie généralement sur les 4 étapes suivantes :

Etape 1 : Identifier le besoin de continuité

. Recenser les opérations de l’organisation qui sont critiques, essentielles à sa survie. Ce recensement est réalisé via le Bilan d’Impact sur les Activités (BIA). Puis analyser les risques qui pèsent sur les opérations critiques.

Le Bilan d’Impact sur les Activités représente la fondation d’une Gestion de la Continuité d'Activité ; il permet de :

  • identifier les opérations critiques de l’organisation, les impacts et les effets de la perte, de l’interruption ou de la perturbation de ces opérations critiques,
  • prendre conscience des mesures à prendre pour augmenter la capacité d’adaptation de l’organisation vis-à-vis des opérations critiques,
  • prendre conscience de la valeur générée par les opérations critiques, et donc définir la priorité de leur restauration.
  • fournir à l’organisation une check-list des ressources minimales à mettre à disposition dans le temps pour restaurer les opérations critiques, en fonction des priorités.

L’analyse de risques associée au BIA permet d’identifier :

  • les menaces internes et externes, les responsabilités, le degré d’exposition aux risques qui pourraient provoquer la perte, l’interruption ou la perturbation des opérations critiques,
  • la probabilité d’occurrence des menaces,
  • le degré de vulnérabilité de l’organisation face aux menaces,
  • les mesures de réduction, de contournement, d’acceptation ou de transfert du risque.

Etape 2. Déterminer et choisir parmi les stratégies alternatives permettant le maintien de l’exécution des opérations critiques.

Il existe globalement quatre modèles stratégiques de Gestion de Continuité d'Activité :

  • modèle site actif/site de copie dormant,
  • modèle site actif/site actif (ou modèle éclaté),
  • modèle site actif/site actif alternatif périodique.


Etape 3. Elaborer et mettre en œuvre une réponse permettant le maintien de l’exécution des opérations critiques.

La réponse s’appuiera sur trois types de plans de reprise :

  • le plan de continuité des activités,
  • le plan de secours technique,
  • le plan de gestion de crise.

Etape 4. Tester, maintenir et auditer la réponse.

Puis retour à l’étape 1.

BS 25999

La norme BS 25999

La Norme BS 25999 comporte deux parties distinctes :

  • Partie 1 - Recueil d'instructions : fournit des recommandations sur les bonnes pratiques de BCM qui ne figurent dans le document que sous la forme de conseils.
  • Partie 2 - Spécifications :  fournit les conditions pour un « Système de Management de Continuité d'Activité » (BCMS) basé sur les meilleures pratiques en matière de BCM. C'est la partie de la norme qui peut être utilisée pour démontrer la conformité à travers un audit et un processus de certification.

Principes de Continuité d'Activité

Gestion de la continuité d’activité

Une approche globale qui comprend la politique, les règles et les procédures pour garantir le maintien ou la reprise des opérations spécifiées d'une façon planifiée en cas de perturbation. Son but est de réduire au minimum les conséquences opérationnelles, financières, légales, de réputation et autres conséquences substantielles résultant d'une perturbation. (Principes directeurs en matière de continuité d’activité - COMITÉ DE BÂLE)

L’AFNOR n’a pas encore donné de définition précise par rapport aux termes anglo-saxon BCP (Business continuity Plan et DRP (Disaster recovery Plan). Nous utiliserons les définitions suivantes:

  • Un plan de continuité d’activité (ou PCA) vise à proposer des solutions de secours en cas de sinistre grave :
    • tant pour la continuité des opérations métiers ou PCO (destruction des sites de bureau par exemple)
    • que pour le la continuité des systèmes d’information dénommé PRA (Plan de Reprise des Activités Informatiques).

 

 


Copyright Ysosecure © 2002 - 2019