Mardi matin, une large partie du Web mondial s’est retrouvée inutilisable pendant plusieurs heures. Des milliers de sites, services, applications, systèmes de connexion ou encore plateformes de médias sociaux ont été indisponibles, ou partiellement accessibles, en raison d’une défaillance massive chez Cloudflare, l’un des principaux acteurs mondiaux de la sécurité et de l’optimisation du trafic internet.
Breizh-info a été affecté comme beaucoup d’autres médias, rendant l’accès impossible ou très dégradé durant une partie de la journée. Nous présentons à nos lecteurs toutes nos excuses pour ce désagrément indépendant de notre volonté.
Quelques heures après la restauration progressive des services, Cloudflare a reconnu une erreur interne, totalement dépourvue de caractère malveillant, et publié une analyse détaillée de l’incident.
Une panne née d’une modification interne, pas d’une attaque
Contrairement aux premières hypothèses formulées au moment du chaos numérique, la panne n’était pas liée à une cyberattaque ni à une tentative de déni de service.
Selon Cloudflare, l’origine du problème se situe dans une modification des permissions d’accès d’une base de données utilisée par son système de gestion automatisée des bots.
Cette modification a généré un fichier de configuration anormalement volumineux, deux fois plus gros que prévu. Ce fichier, une fois propagé dans le réseau mondial de Cloudflare, a dépassé une limite interne codée dans les logiciels assurant le routage du trafic. Résultat : une défaillance en chaîne du proxy interne de l’entreprise, le cœur même par lequel transitent des milliards de requêtes chaque jour.
Les erreurs se sont manifestées sous forme de pages « 5xx », d’impossibilité de se connecter, d’API bloquées, voire d’effondrement complet de certains services, notamment ceux utilisant la technologie de vérification « Turnstile », intégré à de nombreux systèmes de connexion.
Une panne étrange, fluctuante, avant de s’aggraver
Particularité notable : la panne n’était pas immédiatement stable.
Comme la base de données n’avait été que partiellement mise à jour, la génération de ce fameux fichier défectueux alternait avec une version correcte.
Tous les cinq minutes, selon que la requête passait par une partie mise à jour ou non, le système pouvait soit fonctionner normalement, soit s’effondrer à nouveau.
Cette instabilité a d’abord fait croire à une attaque massive, d’autant que la page de statut publique de Cloudflare – pourtant hébergée en dehors de son réseau – s’est retrouvée elle aussi indisponible, un malheureux hasard ayant semé le doute jusque dans les équipes techniques.
Lorsque tous les nœuds du réseau ont fini par générer le mauvais fichier, la panne est devenue totale.
Une restauration progressive, mais des millions d’utilisateurs impactés
Cloudflare a mis fin à la propagation du fichier défectueux vers 14h30 UTC, avant de réinjecter manuellement une version fiable dans tout son réseau mondial.
La reprise s’est faite progressivement, avec des lenteurs et des erreurs résiduelles pendant plusieurs heures, notamment sur les services de connexion et les systèmes utilisant « Workers KV ».
L’incident, considéré comme le plus grave depuis 2019 pour l’entreprise, a duré officiellement environ six heures. Mais pour de nombreux sites – dont Breizh-info –, les impacts ont été plus longs à dissiper.
Les excuses de Cloudflare
Le directeur général de Cloudflare, Matthew Prince, a présenté des excuses publiques très fermes : « Nous avons laissé tomber Internet aujourd’hui. Cet incident est profondément douloureux pour toute notre équipe. »
L’entreprise a annoncé une série de mesures destinées à empêcher qu’une telle erreur se reproduise :
– durcissement des systèmes acceptant des fichiers internes,
– ajout de « kill switches » permettant de désactiver instantanément un module défaillant,
– amélioration des outils de diagnostic,
– révision complète des scénarios de défaillance.
Cet épisode démontre une nouvelle fois la dépendance croissante de l’écosystème numérique mondial à quelques grands acteurs dont les infrastructures supportent une part gigantesque du trafic Internet.
Une simple erreur interne peut, comme ce 18 novembre, provoquer une réaction en chaîne qui affecte des millions d’utilisateurs et des milliers de services, du petit site d’information au géant mondial du numérique.
Illustration : Pixabay (cc)
[cc] Article relu et corrigé (orthographe, syntaxe) par ChatGPT.
Breizh-info.com, 2025, dépêches libres de copie et de diffusion sous réserve de mention et de lien vers la source d’origine