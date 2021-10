Entre 9h20 et 10h30 ce 13 octobre, bon nombre de sites hébergés chez OVHCloud n'étaient plus accessibles, du moins pour une partie de la population. Parmi les sites touchés se trouvaient plusieurs des publics comme celui de l'Assemblée nationale, ceux d'entreprises comme Interflora ou encore de nombreux blogs.

La temporalité de l'incident s'avère catastrophique pour l'entreprise, qui entre en Bourse dans deux jours. Surtout, elle a rappelé un mauvais souvenir : en mars 2021, OVHCloud avait subi une panne mémorable à cause de l'incendie de son data center strasbourgeois, et forcément, le nouvel incident a ravivé les inquiétudes. Heureusement, bien qu'il ait eu un impact à l'échelle globale de l'entreprise, le problème du jour a des effets bien moindres.

Une panne de connexion

« C'est une panne sans être une panne », souffle un expert à la Tribune. Concrètement, les serveurs d'OVHCloud ne sont pas tombés en panne, ils n'étaient simplement plus accessibles... à un certain type de connexion. Pour que votre navigateur se connecte aux machines d'OVH sur lesquelles se trouvent les sites, elles doivent connaître leurs adresses IP, un identifiant compris par les machines.

Deux protocoles coexistent pour attribuer ces adresses : l'IPv4 et l'IPv6. Lors de la panne, les serveurs d'OVH n'affichaient plus l'IPv4... mais encore l'IPv6. Autrement dit, si votre fournisseur d'accès internet fonctionnait en suivant les IPv6, il pouvait encore accéder à certains sites internet, pourtant « en panne » chez d'autres. Ou alors, une même personne pouvait se connecter à un site touché via le Wi-Fi de son entreprise, mais pas par la 4G de son smartphone. Avec quelques réglages réseaux, n'importe qui aurait pu se connecter aux sites qui affichaient l'IPv6 (lui-même tombé en panne, mais seulement 7 minutes, selon l'expert réseau Stéphane Bortzmeyer.

Ce qu'il faut retenir, c'est que l'incident n'a pas affecté le fonctionnement des serveurs, et n'a donc donc pas touché l'intégrité des données qui sont stockées dessus. Et si les clients de l'hébergeur ont dû accuser un ralentissement de leur activité puisque leur site était introuvable pour certains utilisateurs, le problème n'a duré qu'une heure. En comparaison, l'incendie d'il y a 5 mois avait détruit d'importants volumes de données, avec des conséquences graves sur plusieurs semaines pour les victimes.

Ce genre de problème lié au fonctionnement même d'Internet touche même les plus gros acteurs de la tech. La semaine dernière Facebook subissait une panne de 6 heures sur l'ensemble de ses services : c'était là aussi un problème de connexion, et non de serveurs.

Une erreur de configuration humaine à l'origine de l'incident

A l'origine de l'incident du jour se trouve un raté lors d'une opération de maintenance de routine. Elle avait lieu sur le data center de l'entreprise situé sur la côte Est des Etats-Unis à Vint Hill, en Virginie, afin d'« améliorer le routage », c'est-à-dire la façon dont les machines communiquent sur Internet. Dans son communiqué, l'entreprise précise que « ces interventions visaient à améliorer les protections anti DDoS, attaques qui ont été particulièrement intenses ces deux dernières semaines ».

Les DDoS, ou attaques par déni de service, consistent à surcharger en connexion les serveurs de l'entreprise ciblée, jusqu'à ce que les machines ne puissent plus tenir le volume de trafic et tombent hors ligne. Signe de leur augmentation, Microsoft expliquait en début de semaine qu'elle s'était confrontée à la plus grosse attaque jamais enregistrée sur son cloud Azure.

La maintenance d'OVHCloud se tenait donc en pleine nuit à l'heure locale, soit entre 9h et 10h30 à l'heure française. L'entreprise n'attendait « aucun impact », sur le reste de son infrastructure, puisque la machine concernée par l'opération devait être isolée. Et dans le pire des cas, l'impact n'aurait dû toucher que les Etats-Unis, avec des conséquences moindres en pleine nuit. Problème : une simple erreur humaine de configuration a suffi à complètement désorganiser les routeurs d'OVHCloud. Dans un tweet rapidement supprimé, Octave Klaba expliquait qu'un copier-coller de trop dans le terminal de configuration de la machine en maintenance avait suffit à causer l'incident. Finalement, la machine qui a déclenché l'incident a été retirée du réseau et tout est revenu à la normale.

La confiance, le principal problème d'OVHCloud

Quel impact de cette panne sur l'entrée en Bourse de l'entreprise dans deux jours ? D'après les analystes consultés par La Tribune, une panne de ce type arrive même aux géants mondiaux comme Amazon Web Services ou Microsoft Azure, et n'est pas de nature à impacter profondément la perception des investisseurs vis-à-vis de l'entreprise.

"Les investisseurs vont certainement relativiser cet incident car dans l'absolu ce n'est pas une panne grave, affirme Jacques-Aurélien Marcireau, co-directeur de la gestion actions chez Edmond de Rothschild Asset Management. Le problème, c'est surtout que c'est la deuxième panne en six mois, et même si l'entreprise a réagi rapidement et efficacement, cela ne vient pas consolider la confiance, à la fois pour les clients et pour les investisseurs".