La souveraineté des données, l'astuce de la startup française LightOn pour se frayer un chemin dans la course à l'IA

Alors que la course à l’intelligence artificielle générative fait rage entre les mastodontes Microsoft, Google, Meta ou encore Nvidia, une startup française espère creuser son trou grâce à son modèle de distribution axé sur la souveraineté des données. Partie suffisamment tôt pour être dans le coup, LightOn cherche désormais d’importants financements pour suivre le rythme effréné du secteur.
François Manens
LightOn ambitionne de creuser sur son trou dans un marché de l'intelligence artificielle envahi par les géants américains de la tech.
LightOn ambitionne de creuser sur son trou dans un marché de l'intelligence artificielle envahi par les géants américains de la tech. (Crédits : iStock)

Et si une entreprise française parvenait à se frayer un chemin dans la course à l'intelligence artificielle ? Bien moins en vue que les géants américains de la tech (Microsoft, Google, Meta...), la startup LightOn a développé depuis 2020 son propre équivalent de GPT, intégré à une plateforme baptisée Paradigm, et propose des cas d'usages similaires. Face à la puissance de feu des Etats-Unis, la jeune pousse tente de se différencier par son modèle de distribution, qui lui a déjà permis de convaincre quelques grands comptes. Mais elle va très vite avoir besoin de liquidités pour rester dans la course impitoyable à l'intelligence artificielle qui se profile.

Une course à l'IA lancée en 2020

Tout commence en mai 2020. La startup américaine OpenAI présente publiquement GPT-3, une nouvelle version de son intelligence artificielle capable d'écrire des textes à partir d'une consigne de quelques mots, qui donnera naissance un an et demi plus tard à ChatGPT. Pour les dirigeants de LightOn, GPT-3 fait plus qu'améliorer les performances de son prédécesseur GPT-2, sorti en 2018. Ils estiment qu'un véritable cap est franchi. « Nous avons été scotchés par sa capacité à réaliser des tâches pour lesquelles il n'était pas entraîné, ce qu'on appelle le "zero shot learning" dans le jargon. Nous avons compris immédiatement que la technologie aurait un impact monstrueux en termes économiques et sociétaux », explique à La Tribune Laurent Daudet, cofondateur et co-dirigeant de LightOn.

Mais à l'époque, la startup ne développait pas de modèle de langage. Créée en 2016, elle s'attelait à construire un processeur photonique, une nouvelle technologie de puces, avec la promesse d'accélérer les apprentissages des intelligences artificielles. La jeune pousse fondée par quatre chercheurs avait poussé son projet jusqu'à la pré-production, mais peinait à convaincre le marché. « Notre technologie intéressait les chercheurs et les divisions de R&D, mais nous n'arrivions pas à passer le cap d'après », constate le dirigeant. Après avoir consulté son investisseur principal, le fonds Quantonation (spécialisé dans le calcul de haute performance et l'informatique quantique), la startup valide son pivot et commence à travailler sur son modèle de langage.

Un modèle de distribution pour se différencier

Pour survivre dans un secteur pris d'assaut par Microsoft, Google ou encore Meta, LightOn décide de ne pas aller à la confrontation directe. Alors que les mastodontes misent sur un modèle de distribution de « model-as-a-service », où l'utilisateur se connecte au modèle d'intelligence artificielle par le biais d'une API [un connecteur à son infrastructure, facile à intégrer, ndlr] et paie le service à la requête, l'entreprise française propose de son côté un modèle « on premise ». Concrètement, elle fournit une licence d'un an à son client, qui installe les services directement sur son infrastructure. Il paie ainsi un coût fixe élevé en une fois -« du même ordre que les logiciels d'entreprise » soit plusieurs dizaines de milliers d'euros- pour un usage illimité.

Avec ce modèle, la startup mise sur la notion de souveraineté des données, essentielle dans certaines industries sensibles, comme la défense, l'énergie ou encore la finance, puisque aucune information ne va quitter l'infrastructure du client. A l'inverse, si les API permettent d'accéder rapidement et à moindre coût au service, elles ouvrent aussi un canal de données sortantes vers un prestataire -ici, le développeur du modèle d'intelligence artificielle-, et ce fonctionnement peut rapidement tourner au casse-tête si l'IA doit traiter des informations sensibles.

Comme preuve de ce risque, OpenAI doit régulièrement rappeler à ses utilisateurs de ne pas partager d'informations sensibles de leur entreprise avec la version grand public de ChatGPT, puisqu'elles sont susceptibles d'apparaître dans les réponses de l'outil à d'autres utilisateurs. La semaine dernière, la presse coréenne a par exemple rapporté que trois employés de Samsung ont involontairement fait fuiter des données du groupe par leur usage de ChatGPT. Deux d'entre eux ont partagé du code afin de le faire corriger et optimiser par l'IA, tandis que le troisième larron a demandé à l'outil de résumer ses notes prises lors d'une réunion stratégique... Certes, les offres d'API pour les entreprises intègrent des garanties pour éviter ce genre de scénario, mais la sortie des informations en dehors de l'infrastructure de l'entreprise comporte dans tous les cas un risque supplémentaire.

Partenaire d'Amazon Web Services

Pour autant, le mode de distribution adopté par LightOn s'accompagne de son lot de défauts, comme le risque de prendre du retard dans l'amélioration des modèles. « Les entreprises d'intelligence artificielle veulent avoir les données des clients pour améliorer leurs algorithmes. Or, nous n'allons pas avoir accès à ces données. L'autre avantage du modèle par API, c'est qu'il n'y a qu'une infrastructure à maintenir [celle du développeur de l'IA, ndlr], alors que nous devons pouvoir aider chacun de nos clients sur son infrastructure », détaille Laurent Daudet. Et si le dirigeant est convaincu par son modèle économique, qui lui permet dès à présent de signer des grands comptes dans des industries stratégiques, il n'a dans tous les cas pas vraiment le choix : « sur les API, OpenAI est capable de diviser ses prix par plus de deux en quelques jours, ce n'est pas possible de s'aligner. »

Malgré les inconvénients de son modèle, LightOn ne fait pas bande à part, et a notamment signé un partenariat avec le numéro 1 du cloud Amazon Web Services (AWS). Puisqu'il n'a pas son propre modèle d'IA générative -contrairement à ses concurrents Microsoft Azure (GPT-4) et Google Cloud (LaMDA)- le géant américain signe des partenariats avec des spécialistes de l'écosystème. Outre LightOn, AWS s'est par exemple lié avec la plateforme d'hébergement et de partage de modèles d'intelligence artificielle HuggingFace. « Le partenariat avec AWS est gagnant-gagnant. Ils nous mettent au contact de clients potentiels et si nous les signons, ces clients auront besoin de capacité de calcul, et loueront donc des serveurs chez AWS », résume Laurent Daudet, qui rappelle également que ce partenariat ne s'accompagne pas de clause d'exclusivité.

Besoin d'accélérer pour suivre la course

Malgré ses atouts, LightOn ne reste qu'un petit poucet dans une course d'ogres et va avoir besoin de liquidités pour suivre le rythme. « Nous réalisons déjà un chiffre d'affaires significatif et notre activité d'exploitation est rentable, sinon nous serions morts depuis longtemps », explique le dirigeant. La startup devrait boucler une levée de fonds d'ici à la fin de l'année et affiche de grandes ambitions : « nous visons une trajectoire de financement à la Pasqal ». Cette startup, qui construit un ordinateur quantique, a bouclé début 2023 une levée de fonds de 100 millions d'euros, moins d'un an et demi après avoir conclu une levée de 25 millions d'euros, devenant ainsi une figure de la deeptech française.

Avec ces ambitions, l'entreprise se projette comme un leader européen d'ici à 2028. Cet objectif passe avant tout par du recrutement, à la fois pour développer la technologie et pour convaincre des clients. « OpenAI a aujourd'hui plus de 300 employés, nous sommes à 25. Mais je ne pense pas que ce soit une taille impossible à rattraper », ambitionne le dirigeant. Mais même si elle parvient à trouver des liquidités à la hauteur de ses attentes, la startup va se confronter à un problème d'infrastructure informatique à moyen terme. Jusqu'ici, elle a entraîné ses modèles sur des supercalculateurs de la recherche publique ou sur l'infrastructure de certains de ses clients. Mais elle ne peut pas s'aligner seule avec les puissances de calcul mises à disposition par Microsoft, Google ou Meta, qui lui coûteraient des millions de dollars.

Alors Laurent Daudet envisage plusieurs scénarios, et espère un soutien des pouvoirs publics européens. Fin mars, le Royaume-Uni a annoncé un plan d'investissement de 900 millions de livres (1 milliard d'euros) pour se doter d'un supercalculateur dernier cri, afin de créer un « GPT britannique ». Ce budget est plus de trois fois supérieur à celui investi dans le supercalculateur italien Leonardo (240 millions d'euros), le plus puissant d'Europe. Forcément, LightOn ne peut qu'espérer une initiative similaire à l'échelle européenne ou française, qui résoudrait en grande partie les freins à son développement.

François Manens

Sujets les + lus

|

Sujets les + commentés

Commentaires 3
à écrit le 18/04/2024 à 14:33
Signaler
Thanks for the informative article. Unogeeks is the top SAP MM Training Institute, which provides the best <a href="https://unogeeks.com/sap-mm-training" > SAP MM Training </a>

à écrit le 17/04/2023 à 9:01
Signaler
Dans ce domaine, on ouvre les frontières et l'on veut être souverain... il y a quelque chose qui cloche dans l'intelligence !

le 18/04/2023 à 7:25
Signaler
T'as pas compris qu'il s'agit d'une souveraineté "virtuelle"... ;)

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.