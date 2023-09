Mistral AI, l'espoir français dans la course à l'intelligence artificielle générative, a sorti ce mercredi son premier large modèle de langage (LLM). En juin, l'équipe fondatrice composée de Arthur Mensch (ex-DeepMind), Guillaume Lample et Timothée Lacroix (tous deux ex-Meta) avait levé un montant record de 105 millions d'euros, après à peine un mois d'existence. Depuis, le gouvernement ne manque pas une occasion de promouvoir la startup à commencer par le ministre délégué à la Transition numérique Jean-Noël Barrot.

Mistral AI avance sur les plates-bandes de Meta

Pour sa première, Mistral AI s'adresse uniquement aux spécialistes de l'IA, et ne s'en cache pas. D'ailleurs, sa première communication n'est autre qu'un lien « torrent » (un lien de téléchargement) vers son modèle, un clin d'œil à la communauté des développeurs. Et ce n'est pas un hasard : la startup drague le milieu de l'open source et ses milliers de développeurs passionnés, prêts à contribuer bénévolement à des projets intéressants. En échange, la jeune pousse autorise l'utilisation gratuite de son modèle de langage dans presque n'importe quel cas de figure. Autrement dit, le monde de l'entreprise et les offres payantes attendront. Pour l'instant, Mistral AI veut fédérer autour de son offre et créer une véritable communauté.

« Un modèle dont le développement est appuyé par la communauté est le chemin le plus sûr pour éviter d'introduire la censure et les biais dans la technologie qui façonnera notre futur », défend Mistral AI dans son communiqué. La startup ambitionne de créer une alternative à « l'oligopole émergent de l'IA », sans nommer expressément les duos OpenAI-Microsoft, Anthropic-Amazon ou encore Google. Mieux, elle se projette en « tête de file » des modèles ouverts, une place pour l'instant occupée par Meta, qui a ouvert en juillet son modèle Llama-2.

Sur son compte X (ex-Twitter), Arthur Mensch précise d'ailleurs que le premier modèle de la startup, composé de 7 milliards de paramètres dépasse en tous points les performances de la version à 13 milliards de paramètres de Llama. Sous-entendu, l'entreprise française serait capable de faire mieux avec moins que Meta, mais faut-il encore le démontrer à plus grande échelle.

OpenAI n'a aucune raison de trembler, pour l'instant

Alors que le nombre de paramètres des LLM enfle à chaque nouvelle itération, Mistral AI se lance avec un modèle très petit dans les standards actuels. Mais cette faible taille nourrit le discours d'Arthur Mensch, qu'il développe dans son entretien avec Le Figaro : la startup veut multiplier les modèles de différentes tailles, pour apporter le meilleur rapport prix/performance pour chaque cas de figure. Il promet ainsi de construire une offre d'IA générative tournée vers la recherche d'économies, dans un secteur pour l'instant extrêmement gourmand en ressources.

A l'inverse, si OpenAI ou Google multiplient aussi les modèles de différentes tailles, ils axent avant tout leur communication autour de leurs plus grands modèles, sorte de navires amiraux. GPT-4 d'OpenAI sert ainsi d'étalon dans le milieu, et de carte de visite pour défendre la supériorité de l'entreprise sur la concurrence. Google devrait sortir d'ici la fin de l'année un modèle encore plus imposant, du nom de Gemini, tandis que Meta a promis que Llama attendrait les performances de GPT-4 dès l'an prochain.

Avant d'inquiéter les ogres de l'IA, la route sera donc longue pour Mistral AI. Et pour y parvenir, il faudra peut-être passer par la démonstration de force : au Figaro, le dirigeant explique que d'autres modèles seront mis à disposition dans les prochains mois, dont certains « beaucoup plus grands et plus performants » sur les tâches difficiles, mais « plus coûteux à utiliser ». La startup doit agir vite : alors qu'elle construit sa communauté et produit ses premiers modèles, les géants américains en sont déjà à l'étape suivante, où ils commercialisent l'IA générative grâce à de nouveaux outils. A Mistral AI de ne pas arriver trop tard.