LA TRIBUNE - Hive veut proposer un cloud distribué. En quoi cela consiste-t-il ?

DAVID GURLÉ - Le cloud Hive fédère et interconnecte les capacités inutilisées des ordinateurs à travers le monde au sein d'un réseau de pair-à-pair. Autrement dit, nous n'avons pas de fermes de serveurs, nous nous appuyons exclusivement sur des ordinateurs qui existent déjà. Pour l'heure, nous proposons une solution de stockage des données, HiveDrive, qui s'appuie sur les différents nœuds du réseau pour héberger des fichiers.

Ces nœuds sont composés de particuliers qui choisissent de donner une partie de leur disque dur au réseau, en échange de quoi ils gagnent la capacité de stocker gratuitement la même quantité de données sur HiveDrive. Ceux qui utilisent moins de capacité de stockage que leur contribution sont rémunérés. À l'inverse, ceux qui veulent en utiliser davantage doivent verser une contribution financière, sur laquelle nous prélevons 5% de frais de transaction.

Début 2024, nous lancerons un service à destination des entreprises, qui vous permettra de déployer HiveDrive comme un réseau privé sur les ordinateurs de votre société. Ensuite, notre ambition est d'aller au-delà du stockage et de proposer également du calcul. Au second semestre 2024, nous prévoyons d'introduire Kubernetes sur le réseau Hive, afin que vous puissiez déployer des workloads dessus. Nous allons ainsi progressivement améliorer le service, proposer à terme de l'hébergement de sites web, des serveurs d'email...

Quel est l'intérêt d'un cloud distribué par rapport aux solutions que proposent des sociétés comme AWS ou Google Cloud ?

La consommation énergétique, d'abord. On sait combien les centres de données sont gourmands en la matière, notamment parce qu'il faut refroidir les serveurs. Le coût énergétique annuel d'un gigaoctet stocké sur le cloud est en moyenne un million de fois supérieur à celui d'un gigaoctet stocké sur votre propre disque dur. L'idée de Hive, c'est d'éviter le gâchis en allant chercher des ressources qui existent déjà pour effectuer du stockage et du calcul. On compte aujourd'hui environ 20 millions d'ordinateurs dans les centres de données des grands fournisseurs cloud. Il y a, dans le même temps, trois milliards d'ordinateurs connectés à l'internet : si l'on mobilisait ne serait-ce que 1% de ces ordinateurs au service d'un cloud distribué, on obtiendrait des ressources bien plus élevées à un coût énergétique moindre.

La technologie décentralisée est également idéale pour construire un cloud souverain, puisque les données ne sont pas entre les mains d'un seul acteur technologique centralisé, mais distribuées au sein d'un réseau de pair-à-air. Chaque particulier, chaque entreprise peut ainsi répartir ses données comme bon lui semble sur différentes zones géographiques. Si vous ne voulez pas être sous le coup du CLOUD Act, par exemple, vous pouvez faire en sorte qu'aucune de vos données ne soit stockées aux États-Unis.

Votre collaboration avec l'Inria vise justement à lancer une offre de cloud souverain. Comment s'est mis en place ce partenariat et en quoi va-t-il consister ?

Nous avons identifié un certain nombre de problèmes que nous devons encore résoudre pour construire un cloud pair-à-pair à grande échelle, par exemple la meilleure façon d'ouvrir les accès et permissions sans autorité centrale : comment assurer une distribution de la confiance ? Mais aussi la question du placement et de la réparation des données.

L'objectif du partenariat avec l'Inria est de se pencher sur ces questions et de les résoudre. Huit ingénieurs, chercheurs et docteurs en informatique vont y travailler au sein d'une structure commune. L'Inria est un organisme de réputation mondiale, doté d'une excellente expertise technologique, et nous sommes très enthousiastes à l'idée de relever ce défi avec eux.

L'ambition de ce partenariat est de montrer que le futur de l'informatique n'est pas lié à un serveur ou à une zone géographique, il est distribué et peut se jouer n'importe où.

Philosophiquement, nous pensons que cette idée d'un réseau comme alternative à une entité centrale qui contrôle tout correspond aux valeurs fédérales européennes, et nous entendons le déployer à grande échelle pour prouver que ça peut marcher.

Un cloud décentralisé n'est-il pas dangereux en matière de cybersécurité ? Comment comptez-vous rassurer les particuliers et les entreprises à ce niveau-là ?

Nous nous fions à l'encryption : les données stockées sur le réseau sont passées par un algorithme de cryptage post-quantique certifié par l'Anssi. Ce chiffrement concerne également les métadonnées, de sorte qu'à aucun moment une information indiquant où exactement tel fichier est stocké ne peut fuiter. Chaque fichier n'est en outre pas stocké tel quel sur le réseau : il est décomposé en une série de shards (fragments), eux-mêmes répartis sur une centaine d'ordinateurs différents. Ainsi, même si l'attaquant arrivait à compromettre l'un des nœuds, les données sur lesquelles il mettrait la main seraient inutilisables.

Enfin, le réseau fonctionne sur un principe zéro confiance. On ne fait à aucun moment confiance à aucun nœud sur lequel HiveDrive est conçu, en partant du principe que chaque nœud peut servir de vecteur à une attaque. On doit donc se protéger, non seulement en encryptant les données, mais aussi en confiant à chaque utilisateur une clé de cryptage unique, à laquelle nous n'avons pas accès : si vous la perdez, vous perdez toutes vos données.

Le marché du cloud est aujourd'hui largement dominé par Amazon, Microsoft et Google, qui ont chacun des ressources financières quasi illimitées à leur disposition. Quelle taille critique votre réseau doit-il atteindre pour espérer rivaliser avec eux ?

C'est difficile à dire, car cela ne dépend pas seulement du nombre d'ordinateurs, mais aussi de la façon dont ils sont répartis à travers le monde : pour maximiser l'efficacité et limiter les risques, il faut qu'ils se situent au maximum dans des zones géographiques, sur des grilles énergétiques et sur des fuseaux horaires différents. Je dirais qu'à partir de 10.000 ordinateurs bien distribués dans le monde, on pourra offrir un service aussi fiable, sinon meilleur que celui des Gafam, et pour un coût bien inférieur.

Lorsqu'ils veulent augmenter les capacités de leur cloud, les Gafam n'ont qu'à construire de nouveaux serveurs. Vous serez de votre côté contraint de convaincre un plus grand nombre d'utilisateurs de s'intégrer au réseau. Comment comptez-vous faire pour passer à l'échelle ?

C'est en effet un défi tout aussi grand que le défi technologique qui nous attend ! Nous misons sur les avantages que présente le cloud distribué en matière d'efficacité énergétique, de souveraineté et de contrôle sur ses données personnelles, ainsi que sur un modèle économique qui fait que chacun a intérêt à participer au réseau. Nous sommes aussi fermement convaincus de nous situer dans l'air du temps : l'économie du pair-à-pair est en plein essor, les internautes ont envie de participer à quelque chose de plus grand, et nous pensons donc que notre initiative les intéressera.