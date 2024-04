Trop d'intelligence artificielle, pas assez de puissance de calcul. La startup FlexAI veut remédier à cette préoccupation partagée par l'ensemble de l'industrie. La jeune pousse française, créée par deux anciens de Nvidia, vient de lever 28,5 millions d'euros auprès du fonds luxembourgeois Alpha Intelligence Capital (AIC), le français Elaia Partners et le danois Heartcore Capital.

Sa réponse au problème de la puissance de calcul n'est pas de tenter de concurrencer Nvidia, le principal fournisseur de GPU. Un tel pari serait perdu d'avance. L'entreprise mise plutôt sur un meilleur accès aux calculateurs et une utilisation plus efficace de ces derniers. Son produit, qui sera commercialisé cette année, est une sorte d'infrastructure « universelle ». Celle-ci permettra d'harmoniser les solutions existantes pour faciliter l'accès à des ressources en calcul.

« La demande en puissance de calcul ne cesse d'augmenter depuis le lancement de ChatGPT. Or, le principal fournisseur (Nvidia) est en rupture de stock pour les deux prochaines années. La demande représente approximativement deux fois l'offre existante », souligne Brijesh Tripathi, PDG et co-fondateur de l'entreprise. « Et nous ne sommes qu'au commencement. »

« Métal rare »

Signe de la rareté de cette ressource : le Wall Street Journal rapportait en février dernier que Sam Altman, le PDG d'OpenAI, serait à la recherche de 5.000 À 7.000 milliards de dollars pour créer un grand réseau de fabrication de puces. Le New York Times raconte de son côté la guerre que se livrent les startups du secteur pour obtenir des GPU. « Je considère qu'il s'agit d'un métal rare à ce stade », compare l'un des entrepreneurs interrogé par le média.

Bien que des géants comme Google, Amazon et Microsoft offrent des ressources de calcul pour aider les entreprises manquant de GPU, ces services sont souvent compliqués à utiliser. Chaque fournisseur a ses propres règles et outils, ce qui peut rendre l'utilisation globale déroutante, note Brijesh Tripathi. FlexAI prévoit de résoudre ce problème en introduisant une nouvelle couche logicielle qui unifie ces services divers. L'entreprise collabore avec AMD, Amazon Web Services, Google Cloud, Intel, NVIDIA et InstaDeep. Elle serait également en discussion avec des fournisseurs de cloud français.

En plus de manquer de GPU, on les utilise mal

Par ailleurs, Brijesh Tripathi estime que l'infrastructure de calcul actuelle dédiée à l'IA est peu fiable. « Elle est comparable à l'industrie générale des supercalculateurs d'il y a vingt ans ». Résultat : les entreprises n'utilisent pas l'ensemble des capacités de calcul à leur disposition. « Même en faisant des efforts, OpenAI n'utilise qu'à 50 % ses ressources », estime Dali Kilani, l'autre co-fondateur.

FlexAI vise à maximiser l'efficacité de l'utilisation des ressources informatiques. Elle travaille non seulement à mieux coordonner les couches logicielles entre elles, mais aussi à optimiser la connexion entre les serveurs. Elle revendique des gains d'efficacité de 20 à 30 %. Pour ce faire, elle mise sur une équipe pluridisciplinaire de 40 salariés dont 25 en France, 12 en Inde dédiés notamment au développement de son propre serveur, et 3 aux États-Unis.

« Être en France nous a aussi permis d'accéder à ces compétences, Paris étant devenu un hub de l'intelligence artificielle », souligne Dali Kilani. « Aujourd'hui, seule une poignée d'entreprises - Meta, OpenAI, Microsoft - possèdent des équipes suffisamment massives pour couvrir toutes ces connaissances », ajoute-t-il Dali Kilani.

La startup entend également changer le modèle d'affaires de la location de GPU. Aujourd'hui, les entreprises louent un certain nombre de GPU pour un coût fixé à l'heure. Le système de FlexAI sera différent. Ses clients auront un prix fixé pour le projet qu'ils souhaitent développer, et s'il dure plus longtemps, s'il y a des problèmes, le prix restera le même, promet l'entreprise. « C'est un système à la Uber », compare Dali Kilani. « Vous connaissez le prix de la course avant de monter dans le véhicule. C'est un point important parce que de nombreuses entreprises soulignent à quel point l'imprévisibilité des coûts de l'IA est un frein. »

Dans le viseur : des développeurs de LLM comme Mistral

FlexAI cible d'abord des développeurs de grands modèles de langage européens, avec lesquels elle serait en discussion. On pense notamment à Mistral AI ou LightOn, même si l'entreprise ne les cite pas directement. « Eux n'ont pas forcément besoin d'accès aux ressources de calcul car ils sont très bien financés, mais ils cherchent à utiliser ces ressources le plus efficacement possible, c'est-à-dire faire tourner leurs modèles plus rapidement. »

L'autre catégorie de clients visée sont les entreprises, dans divers secteurs (banque, santé...), qui aimeraient dépenser quelques centaines de milliers de dollars, voire un ou deux millions dans un projet d'intelligence artificielle, mais qui aujourd'hui n'ont pas accès aux infrastructures nécessaires. « L'accès aux GPU peut être difficile pour les entreprises qui ne peuvent pas se permettre d'investir des millions. À l'heure actuelle, personne ne vous parlera en dessous de 10 millions de dollars », tranche Dali Kilani. Il estime que FlexAI permet ainsi d'abaisser la barrière d'entrée à l'intelligence artificielle.

Ces deux cibles font de la France et de l'Europe un bon terrain de jeu pour la startup. Aux États-Unis, les grands acteurs de l'IA font partie de l'élite qui a déjà accès à la puissance de calcul nécessaire et aux équipes compétentes pour optimiser leur utilisation.