Pour détrôner les géants de l'IA, Mistral AI drague le monde de l'open source
François Manens
Ce contenu est réservé aux abonnés La Tribune

Le gouvernement français mise gros sur Mistral AI.
DR
François Manens
Ce contenu est réservé aux abonnés La Tribune

Le gouvernement français mise gros sur Mistral AI.
DR
Mistral AI, l'espoir français dans la course à l'intelligence artificielle générative, a sorti ce mercredi son premier large modèle de langage (LLM). En juin, l'équipe fondatrice composée de Arthur Mensch (ex-DeepMind), Guillaume Lample et Timothée Lacroix (tous deux ex-Meta) avait levé un montant record de 105 millions d'euros, après à peine un mois d'existence. Depuis, le gouvernement ne manque pas une occasion de promouvoir la startup à commencer par le ministre délégué à la Transition numérique Jean-Noël Barrot.
Pour sa première, Mistral AI s'adresse uniquement aux spécialistes de l'IA, et ne s'en cache pas. D'ailleurs, sa première communication n'est autre qu'un lien « torrent » (un lien de téléchargement) vers son modèle, un clin d'œil à la communauté des développeurs. Et ce n'est pas un hasard : la startup drague le milieu de l'open source et ses milliers de développeurs passionnés, prêts à contribuer bénévolement à des projets intéressants. En échange, la jeune pousse autorise l'utilisation gratuite de son modèle de langage dans presque n'importe quel cas de figure. Autrement dit, le monde de l'entreprise et les offres payantes attendront. Pour l'instant, Mistral AI veut fédérer autour de son offre et créer une véritable communauté.
« Un modèle dont le développement est appuyé par la communauté est le chemin le plus sûr pour éviter d'introduire la censure et les biais dans la technologie qui façonnera notre futur », défend Mistral AI dans son communiqué. La startup ambitionne de créer une alternative à « l'oligopole émergent de l'IA », sans nommer expressément les duos OpenAI-Microsoft, Anthropic-Amazon ou encore Google. Mieux, elle se projette en « tête de file » des modèles ouverts, une place pour l'instant occupée par Meta, qui a ouvert en juillet son modèle Llama-2.
À lire également
Sur son compte X (ex-Twitter), Arthur Mensch précise d'ailleurs que le premier modèle de la startup, composé de 7 milliards de paramètres dépasse en tous points les performances de la version à 13 milliards de paramètres de Llama. Sous-entendu, l'entreprise française serait capable de faire mieux avec moins que Meta, mais faut-il encore le démontrer à plus grande échelle.
François Manens