Avec les pannes d’AWS et Cloudflare, j’ai vu énormément de critiques sur le fonctionnement actuel des entreprises: “C’est irresponsable d’être dépendant d’un seul cloud.”, “Il faut arrêter de dépendre exclusivement d’AWS”, “On a recrée notre propre Cloudflare avec de l’IA” (véridique, venant d'une figure de la tech)
L’idée est bonne, mais selon moi, c’est très loin de la réalité terrain : AWS, Cloudflare, GCP, OVH 🇫🇷🥖, Azure… Aucune de ces solutions n’est infaillible.
La question ne devrait donc pas être : “Comment éviter 100% des pannes ?” mais plutôt “Quel niveau de risque est acceptable pour mon business ?”. Parce que derrière le fantasme du multi-cloud, il y a :
→ plusieurs infrastructures à maintenir
→ des plus grosses équipes
→ une complexité supplémentaire dans les déploiements
...
Tout le monde en parle. Très peu peuvent se le permettre.
💸 La vraie question : combien me coûte une heure de downtime ?
Avant de basculer dans une architecture plus complexe, posez deux chiffres :
❓ Combien coûte une heure / une journée d’indisponibilité ?
❓ Combien coûte une architecture conçue pour éviter ces indisponibilités ?
Pour la quasi totalité des entreprises avec qui nous travaillons :
👉 le coût du multi-cloud est supérieur à l’impact business d’une panne ponctuelle. Ce n’est pas “se reposer sur ses lauriers”, c’est juste rationnel.
Quand tu es dev et que tu as ces paramètres en tête alors tu peux plus facilement concevoir une solution hyperrésiliente.
Etape 1 : avoir deux noms de domaine avec des serveurs DNS différents
Etape 2 : avoir une classe "resolveur" qui s'appuie sur ces deux DNS pour trouver les ressources (base de données, etc..)
etc...
Bref aujourd'hui il est facile d'avoir du 100% disponible en travaillant intelligemment avec du serveur metal, sans exploser les coûts.