Pourquoi Facebook a disparu d'Internet pendant 6 heures ?

Le 4 octobre, pendant une durée rare de 6 heures, l'intégralité des services de Facebook (Instagram, WhatsApp, Messenger...) ne fonctionnaient plus. La raison ? Une erreur de configuration d'un protocole d'échange, qui a eu pour effet de faire disparaître d'Internet les serveurs de l'entreprise. Explications.
François Manens
(Crédits : Dado Ruvic)

C'est le genre d'événement qui rappelle qu'Internet n'est qu'un ensemble (certes, très complexe) de machines qui communiquent entre elles. Le 4 octobre 2021, entre environ 17h48 et 0h03 (un record depuis 2019), Facebook a disparu d'Internet. Disparu, car plus aucun ordinateur ne parvenait à trouver les machines de l'entreprise sur le gigantesque réseau pour s'y connecter.

C'est tout l'empire de Mark Zuckerberg qui n'était plus accessible. Les messageries WhatsApp et Messenger, les réseaux sociaux Facebook et Instagram, l'outil de travail collaboratif Workplace, la plateforme de réalité virtuelle Oculus, mais aussi l'email de l'entreprise ou encore... le système de badges de sécurité des bâtiments du groupe. Les sources internes d'un journaliste du New York Times comparaient la paralysie du groupe à celle d'un "jour de neige" où il serait impossible d'aller travailler. Du côté de la Bourse, l'incident a immédiatement été sanctionné : le cours de l'action a plongé de 6%, avec pour conséquence une baisse de la fortune virtuelle de Mark Zuckerberg de 7 milliards de dollars.

Une erreur de configuration

Dans un communiqué publié le 5 octobre vers 6 heures, Facebook a écarté la piste d'un incident de sécurité, et confirmé qu'il serait dû à une erreur humaine, sans entrer dans les détails : « Nous voulons préciser à ce stade que nous pensons que la cause première de cette panne était un changement de configuration défectueux. » L'entreprise ajoute également que la nature même du problème a compliqué l'accès de ses équipes aux outils pour le réparer, ce qui explique le délai de la réponse à incident.

Pour comprendre comment la 6e entreprise la mieux valorisée au monde se retrouve hors ligne pendant toute une demi-journée, il faut s'intéresser au fonctionnement du web. Comme l'écrit le spécialiste des réseaux Stéphane Bortzmeyer : « quasiment toute activité sur l'Internet commence par une requête DNS. »

Concrètement, lorsqu'un internaute entre « https://fr-fr.facebook.com/ » dans son navigateur, un intermédiaire (le DNS pour Domain Name Server) va se charger de trouver à quelle adresse IP se trouve le serveur du site. Cette adresse IP -composée de chiffres, comme 69.63.176.13- correspond à son emplacement sur le gigantesque réseau qu'est Internet. Elle apporte donc une véritable information aux machines, là où l'adresse en lettres que nous lisons n'a aucune valeur pour elles. C'est donc grâce au rôle de traducteur des DNS que votre ordinateur peut établir la connexion avec ceux de Facebook.

Facebook ne communiquait plus avec le reste d'Internet

Le problème, c'est que dans la soirée du 4 octobre, les DNS ne trouvaient plus comment résoudre les requêtes vers les services de Facebook. Les navigateurs renvoyaient donc aux utilisateurs des messages d'erreur, puisque sans les adresses de destination, la connexion aux différents sites ne pouvait pas s'établir.

Les pannes de DNS sont un type d'incident relativement régulier dans le milieu. Mais elles ne concernent habituellement pas tous les services d'une entreprise, et surtout, elles sont résolues en l'espace d'une paire d'heure. « C'était comme si quelqu'un avait "arraché les câbles" de tous leurs data centers en même temps et les avaient déconnecté d'Internet », écrit Cloudflare, un des principaux acteurs du secteur, qui a pu observer l'incident de Facebook sur l'infrastructure d'Internet.

Et pour cause : le problème de Facebook n'était pas au niveau des DNS. Il se trouvait encore un cran plus haut dans la chaîne du fonctionnement d'Internet. L'entreprise avait changé la configuration de son Border Gateway Protocol (BGP), un protocole d'échange dont elle gère elle-même le paramétrage. « Le BGP permet à un réseau (par exemple celui de Facebook) d'indiquer son existence aux autres réseaux qui constituent internet », vulgarise Cloudflare. A cause de l'erreur de configuration commise par les ingénieurs, le réseau de Facebook ne communiquait plus correctement la position des machines de l'entreprise et les routes pour y accéder. Autrement dit, il fait disparaître de la carte d'Internet, les chemins pour trouver ces machines (et notamment ceux employés par les DNS).

L'incident -bien que relativement court- a donné un aperçu d'un monde sans Facebook, et fait réaliser la dépendance de toute une frange de la population à ses services. Nul doute qu'il fera date, et il pourrait servir d'argument à ceux qui critiquent l'omniprésence des Gafam.

François Manens

Sujets les + lus

|

Sujets les + commentés

Commentaires 11
à écrit le 06/10/2021 à 4:43
Signaler
Prochain episode. Vents solaires et destruction de bcp de satellites en orbite. L'homme est tres fragile malgre son orgueil incommensurable.

à écrit le 05/10/2021 à 23:47
Signaler
6 heures de disparition qui préfigurent la disparition où tout au moins le démantèlement de l' univers Facebook.

à écrit le 05/10/2021 à 19:07
Signaler
Et s'il s'agissait d'une simulation grandeur nature de black out, avant mise en œuvre effective, comme celle d'octobre 2019 aux US sur une pandémie devenue bien réelle trois mois plus tard ?

à écrit le 05/10/2021 à 18:16
Signaler
A ce niveau, une telle erreur dénote une organisation totalement défaillante 1) pas de process de test de mise à jour 2) pas de process de retour arrière 3) pas de process de reprise sur crise. Moralité : ce n'est pas parce qu'on est gros qu...

à écrit le 05/10/2021 à 13:43
Signaler
Les suicides seront ils comptés ?

à écrit le 05/10/2021 à 11:41
Signaler
peut etre un rapport avec la plainte de D.TRUMP pour bannissement qui ne risquait pas d'aboutir...?

à écrit le 05/10/2021 à 11:35
Signaler
J’espère que la terre a continué de tourner.

à écrit le 05/10/2021 à 9:35
Signaler
Une certitude, l'explication est "vaseuse". Cet événement en dit long sur le fonctionnement, la sécurité des réseaux sociaux et donc son intérêt en somme tout relatif.

à écrit le 05/10/2021 à 9:32
Signaler
Pendant ce temps : Les Russes sont sous surveillance. Face à la multiplication d'incidents violents, Moscou a mis au point une technologie permettant de surveiller les réseaux sociaux et de repérer les comportements "destructeurs" au sein de la je...

à écrit le 05/10/2021 à 9:24
Signaler
Maintenant on sait faire, il ne manque que l'endroit et la bonne personne pour faire un contrat, une période d'élection par exemple!

à écrit le 05/10/2021 à 8:30
Signaler
Voir tout ces gens désemparés à la télé était bien rigolo en tout cas, homo sapiens était perdu !

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.