PRA et PCA : le Graal de la résilience de votre messagerie professionnelle
Dans le monde de technologies en constante évolution, une chose est sûre : la messagerie électronique est l’épine dorsale de la communication de toutes les organisations. L’e-mail est le moyen de communication le plus utilisé par les entreprises, les administrations, tous types d’établissements, organisations et associations. Dans un monde idéal, la messagerie, tout en continuant à évoluer, ne devrait jamais s’arrêter, y compris lors des mises à jour qu’on rêve transparentes pour l’utilisateur, indépendamment des changements à effectuer.
Dans cet article nous dévoilons les travaux entrepris pour atteindre le « zéro interruption programmée de service ». Cela signifie que les utilisateurs ne devraient jamais ressentir la moindre perturbation de leur messagerie, même lors de mises à jour ou de changements techniques en coulisse.
PCA et PRA : les alliés de la continuité d’activité
PCA (Plan de Continuité d’Activité) et PRA (Plan de Reprise d’Activité) sont deux concepts piliers à mettre en œuvre dans votre organisation pour en assurer la résilience.
Le PCA (Plan de Continuité d’Activité)
Le PCA recense toutes les actions à entreprendre en cas d’événement perturbateur sur le Système d’Information (SI). L’objectif est de maintenir les activités de l’entreprise, même si cela signifie déplacer les opérations vers un autre lieu ou utiliser des outils et des processus alternatifs. En d’autres termes, le PCA consiste à contourner les obstacles pour minimiser l’impact sur l’activité.
Votre PCA doit répondre aux questions et enjeux suivants (liste non exhaustive !) :
- Quels risques et menaces pourraient perturber votre messagerie professionnelle. Cela peut inclure des pannes matérielles, des attaques de sécurité, des catastrophes naturelles, etc.
- Quels sont vos objectifs, quels sont les niveaux de disponibilité de la messagerie que vous visez ? Pour cela classez vos systèmes et services de messagerie en fonction de leur importance. Par exemple, les e-mails entrants et sortants pourraient être considérés comme critiques, tandis que certaines fonctionnalités pourraient être moins prioritaires (les tâches, le détachement de pièces-jointes etc.).
- La conception d’un plan d’action détaillé incluant les étapes pour la détection de l’incident, la notification des parties prenantes, la mise en œuvre des mesures de secours, la communication avec les utilisateurs, la sensibilisation et la formation de vos équipes, etc.
- Prévoyez une architecture de secours pour votre messagerie professionnelle. Cela peut impliquer la mise en place de serveurs de secours, de centres de données redondants, de sauvegardes hors site, etc.
Le PRA (Plan de Reprise d’Activité)
Alors que le PCA se concentre sur des mesures pour minimiser l’impact d’une perturbation en temps réel et garantir une continuité des opération pendant l’incident, le PRA est, lui, orienté vers l’avenir et prépare à la reprise des activités après l’évènement. Il se concentre sur la restauration des systèmes et des services après un certain temps, par exemple, quelques heures ou jours suivant une perturbation.
En matière de messagerie professionnelle, on y retrouvera les procédures pour restaurer les données à partir des sauvegardes en cas de perte ou de corruption de données, la liste des priorités pour la récupération des boîtes aux lettres en fonction de leur importance, etc. Son objectif est de permettre à l’organisation de reprendre le plus rapidement possible un fonctionnement nominal.
En fin de compte, le PRA et le PCA sont les deux faces d’une même médaille, travaillant de concert pour assurer la résilience de l’entreprise. C’est ce qui garantit une messagerie électronique toujours disponible, quelles que soient les circonstances.
Mise à jour avec BlueMind
Dans un monde idéal, les emails ne doivent jamais s’arrêter ou de façon la plus brève possible, y compris lors des mises à jour qu’on rêve transparentes pour l’utilisateur, quels que soient les changements à effectuer.
BlueMind a grandement amélioré son système de mise à jour standard (in place) et ajoute un nouveau système de mise à jour sans interruption, à partir de la v5 (disponible début 2024) et pour les grands sites et volumes.
La mise à jour standard de BlueMind in place à l’aide du SetupWizard
- arrêt du service
- installation de la nouvelle version (le téléchargement peut être fait en amont)
- transformation des données : exécution des upgraders (programmes qui font faire les changements et mises à jour des données nécessaires)
- relance du service
L’installation de la nouvelle version est un process rapide
Un gros travail a été fait depuis 3 ans pour améliorer la transformation des données afin de permettre l’exécution des upgraders en tâche de fond, après avoir relancé le service. Le principe est que la nouvelle version sait gérer les données à l’ancien format ainsi qu’au nouveau et transforme les données au fur et à mesure. C’est le cas pour tous les nouveaux upgraders et mises à jour, comme par exemple la suppression du serveur Cyrus IMAP pour la v5.
La v5 sait gérer les emails qu’ils soient dans l’entrepôt de Cyrus ou dans le nouveau stockage objet. Quand un mail est demandé, BlueMind v5 le cherche dans le nouveau chemin optimisé et s’il n’y est pas va le récupérer dans l’entrepôt Cyrus. Un processus hot upgrade se charge en tâche de fond de migrer les emails de l’entrepôt Cyrus vers le nouveau stockage.
Mise à jour sans interruption
Mais comment atteindre le « 0 interruption programmée de service » pour la messagerie ? La réponse de BlueMind réside dans l’ajout d’un nouveau système de mise à jour, qui vient compléter l’existant
Ce système, destiné aux très grandes installations, nécessite une deuxième infrastructure , mais il offre bien plus que cela :
- Sauvegarde en temps réel : les données, y compris les e-mails et les documents, sont sauvegardées en temps réel pour éviter toute perte en cas d’incident.
- PRA & PCA sans interruption de service
- Mise à jour sans interruption de service
Le secret réside dans la mise en place de 3 concepts :
- un système de proxy qui permet une bascule transparente du trafic de la plateforme de production vers la nouvelle plateforme, garantissant une continuité sans faille.
- le Stockage Objet pour les données non modifiables, telles que les e-mails et les documents . Ce stockage est partagé entre les instances, ce qui garantit leur disponibilité constante.
- un système de capture des changements pour toutes les autres données
Pour les autres types de données, tels que les calendriers, les contacts, les annuaires, les informations de lecture/non-lecture, etc., BlueMind a mis en place un système de « capture des changements » à l’aide de Kafka.
Principe de capture des changements
Cela signifie que chaque modification est enregistrée en temps réel et peut être reproduite sur une version identique de BlueMind en cas d’incident, ou sur une version supérieure pour préparer une mise à jour.
Conclusion
Pour répondre aux besoins des très grandes installations (plusieurs dizaine de milliers d’utilisateurs) de ne supporter aucun arrêt de service, BlueMind a mis en place une infrastructure solide basée sur Kafka et le stockage objet. Les mises à jour, les Plans de Reprise d’Activité (PRA), et les Plans de Continuité d’Activité (PCA) sont désormais exécutés sans la moindre interruption. Il est même possible de cloner sa production pour des opérations telles que le changement du système d’exploitation ou l’installation d’une préproduction. Notez toutefois que ce type d’infrastructure ne concerne que les très grosses installations avec plusieurs dizaines de milliers d’utilisateurs. Pour les installations plus classiques nous avons procédé à l’amélioration du système standard (in-place).
En somme, BlueMind s’engage à offrir une expérience de messagerie électronique robuste, où la résilience est la clé de voûte, garantissant que la communication au sein des organisations ne connaîtra jamais de coupure, quels que soient les défis qui se présentent.
The post PRA et PCA : le Graal de la résilience de votre messagerie professionnelle appeared first on BlueMind blog.