Intelligence artificielle : le champion français Mistral se hisse au niveau d'OpenAI

Ce lundi, l'entreprise française Mistral a présenté un nouveau modèle d'intelligence artificielle, Mistral Large, aux performances proches des meilleures IA du monde, développées par OpenAI et Google. En parallèle, la startup s'écarte pour la première fois de l'open source en signant un accord de distribution exclusif avec Microsoft, qui entre par ailleurs au capital, pour privilégier l'efficacité de son modèle de langage et mieux en tirer un profit économique.
François Manens
Les fondateurs de Mistral :  Guillaume Lample, Arthur Mensch et Timothée Lacroix
Les fondateurs de Mistral : Guillaume Lample, Arthur Mensch et Timothée Lacroix (Crédits : DR)

La startup française Mistral AI s'attaque pour de bon à la domination de OpenAI, moins d'un an après sa création. Après avoir fait ses armes sur des modèles d'intelligence artificielle de petite taille et levé près de 500 millions d'euros, la jeune pousse a présenté ce lundi Mistral Large. Ce très grand modèle de langage est destiné à concurrencer frontalement GPT-4 d'OpenAI et Gemini de Google, les modèles d'IA les plus performants au monde.

Pour parvenir à ses fins, Mistral a décidé de combattre le feu par le feu, puisqu'il signe, comme OpenAI, un partenariat de distribution (le seul, pour l'instant) avec Microsoft pour son nouveau modèle phare. Cet accord s'accompagne d'un investissement minoritaire (dont le montant exact est gardé secret) au capital de l'entreprise de la part du géant américain, qui a déjà investi plus de 13 milliards dans OpenAI. Alors que Mistral se présentait comme un champion de l'open source en septembre 2023 lors de son lancement opérationnel, et laissait entrevoir une voie alternative, il propose désormais ses meilleures modèles sous le même mode d'accès que OpenAI. Était-ce le prix à payer pour concurrencer les meilleurs ?

Mistral délaisse l'open source pour la performance

A son lancement, Mistral se présentait comme le nouveau « fer de lance » des modèles ouverts, un rôle qu'endossait jusque-là Meta avec sa gamme de modèles Llama. « Nous pensons qu'une approche ouverte à l'IA générative est nécessaire », écrivait l'entreprise, afin de « combattre la censure et les biais dans une technologie qui va modeler notre futur. » L'open source [la publication en accès libre de nombreuses informations techniques sur le modèle, ndlr] était présenté comme la voie idéale pour faire face à « l'oligopole émergent », c'est-à-dire à la mise en place d'un marché seulement composé d'une poignée d'acteurs américains, dont le duo OpenAI-Microsoft et Google, poursuivi par quelques startups très bien financées (Anthropic, Cohere, Inflection AI...). Seul Meta avait pris cette voie.

Dès le lancement de son premier modèle en septembre 2023, la startup a séduit les spécialistes de l'IA, tant par son approche que par ses performances comparées aux modèles fermés. Un second modèle, publié trois mois plus tard et surnommé « Mixtral » par ses utilisateurs, finissait de convaincre le secteur du sérieux et du potentiel de la jeune pousse. Cette dernière laissait entrevoir la possibilité qu'un champion de l'open source parvienne à surpasser les performances des géants américains. Mais dès novembre 2024, Arthur Mensch expliquait que les modèles de Mistral ne seraient pas tous ouverts. Lors de la conférence Artificial Intelligence Marseille organisée par La Tribune, il expliquait déjà que le fait d'avoir opté, dans un premier temps, pour la publications de modèles à code ouvert, « ne veut pas dire qu'on ne développe pas de modèles propriétaires ».

Désormais, la startup dissocie sur son site ses modèles « ouverts », et ses modèles « optimisés » synonymes de fermés. Autrement dit, son activité se compose de deux gammes. Arthur Mensch assume pleinement cette stratégie dans son interview accordée au Monde, et précise qu'elle était prévue dès le début, en plus de rassurer sur l'investissement futur de son entreprise dans l'open source . Reste que Mistral, qui voulait « fermer l'écart de performance entre les solutions boîtes noires et les solutions ouvertes » à son lancement, fait finalement lui-même cet écart au sein de ses propres solutions. Sur X, le cofondateur et directeur scientifique de l'entreprise Guillaume Lample présente le nouveau modèle fermé Mistral Small, qui n'est accessible qu'en passant par la plateforme de la startup ou par le cloud de Microsoft à l'instar de Mistral Large, comme « une alternative significativement plus performante » que son équivalent open source Mixtral...

Mistral sur la voie royale

En s'écartant de l'open source, Mistral résout en partie le problème de la monétisation de ses modèles. Certes, il avait déjà signé des accords avec les plus gros hébergeurs de cloud (Microsoft Azure, Google Cloud et Amazon Web Services) pour distribuer ses modèles contre rémunération, ainsi que lancé sa propre plateforme, bien nommée La Plateforme, pour les distribuer lui-même. Mais en parallèle, ses modèles pouvaient être exploités par n'importe quelle entreprise sans passer par Mistral ou un hébergeur, grâce à l'open source. En passant en mode fermé, les utilisateurs seront contraints de mettre la main au portefeuille pour utiliser les modèles Mistral Large ou Mistral Small, que ce soit en passant directement par Mistral ou par le cloud de Microsoft.

Les entreprises vont forcément être tentées, car avec Mistral Large, la startup a enfin son produit d'appel, la démonstration qu'elle peut vraiment faire aussi bien que les meilleurs. Dans son blog de présentation du modèle, elle utilise pas moins de sept benchmarks [tests de performance, ndlr] pour prouver son propos, avec pour résultat le graphique ci-dessous. Elle se présente comme meilleure que les IA de Google et Anthropic, étant seulement devancé par GPT-4 au général, tout en étant meilleur sur certaines tâches.

Comparatifs Mistral Large

Pour aller encore plus loin dans son opération séduction des entreprises, Mistral a sorti un équivalent de ChatGPT, nommé Le Chat, afin qu'elles puissent tester gratuitement les capacités de Mistral Large, qui sert de moteur à l'outil.

Non seulement, Mistral fait aussi bien que les meilleurs, mais il le fait avec moins. Au Wall Street Journal, Arthur Mensch explique que Mistral Large a coûté moins de 20 millions d'euros à produire, là où le dirigeant d'OpenAI Sam Altman expliquait que GPT-4 avait coûté entre 50 millions et 100 millions de dollars à entraîner, soit plus du double. La startup française est également bien moins financée que ses concurrents, et a une équipe d'une taille bien moins importante. Faire aussi bien, voire mieux, avec moins est le mantra de la startup depuis son lancement, et elle répond pour l'instant à ses promesses.

François Manens

Sujets les + lus

|

Sujets les + commentés

Commentaires 15
à écrit le 27/02/2024 à 9:46
Signaler
L'IA ce sont surtout des clusters de puces Nvidia à 40 000 euros pièce !! il en faut des millions ! Et il faut beaucoup d'énergie pour faire tourner ces machines à inférence statistique... "better be in US for energy and money".

à écrit le 27/02/2024 à 9:44
Signaler
Les fondateurs sont des transfuges de Google et Meta ex facebook. Tout ce qu'ils savent ils l'ont appris au sein de l'écosystème américain, quoi de plus naturel que d'y retourner ? On va encore nous faire croire que mistral est issue de la recherc...

le 27/02/2024 à 11:37
Signaler
Vous préférez donc qu'ils aillent s'installer aux usa pour y créer leur entreprise plutôt que de choisir leur pays où ils ont étudié ? Je lis régulièrement ce type de commentaires où l'esprit d'entreprendre d'innover et d'investir est fustigé voir co...

à écrit le 27/02/2024 à 4:33
Signaler
De toute façon les Américains en passant par l'UE l'aurait coulé. Donc ils ont eu raison de prendre le chemin d'un futur et de plus rémunérateur chez les GAFAM. Je ne sais même pas si ils ont eu une proposition des 27 tellement occupés à faire des...

le 27/02/2024 à 10:04
Signaler
Souviens toi Munich. On y retourne ...surement.

le 27/02/2024 à 14:27
Signaler
@A un homme Azerty mal averti Comparaison n'est pas raison, de nos jours les USA nous demandent des sanctions sur le gaz russe et nous refourguent leur gaz au prix fort, avec cette mentalité, c'est pas sûr que les américains viennent nous sauver la ...

à écrit le 27/02/2024 à 4:27
Signaler
Mistral qui va rivaliser avec ses concurrents US , je suis mort de rire, vu les moyens financiers colossaux dont disposent les Gafam c'est du n'importe quoi. Typiquement français, la méthode Coué dans toute sa splendeur. Cela m'a rappelle l'histoir...

le 27/02/2024 à 9:30
Signaler
Microsoft rentre au capital de mistral (Microsoft = GAFAM). Mistral a fait très fort dans le monde de l'IA (Microsoft ce n'est pas l'état français, il ne jette pas l'argent par les fenêtres) Qwant je suis d'accord, il y avait clairement l'intention h...

le 27/02/2024 à 11:45
Signaler
Erreur et aveuglement "en matière d'innovation " nous sommes performants mais ce sont les chainons suivants qui font défaut ; banques et industriels pour passer du brevet à la phase de développement , industrialisation et commercialisation Pour preuv...

à écrit le 27/02/2024 à 2:26
Signaler
En réalité encore une pépite Française qui passe sous Direction Américaine...et le gouvernement continue de laisser la France se faire piller ...

le 27/02/2024 à 7:24
Signaler
Et on ose nous parler de souveraineté européenne !

à écrit le 26/02/2024 à 22:10
Signaler
"Mistral délaisse l'open source pour la performance". (Rires) Pour l'argent surtout. C'est compréhensible et c'est humain. Mais c'est précisément pourquoi personne ne fera de l'ombre à Microsoft ... qui est rentré au capital. Cqfd ! ll n'y a que...

le 27/02/2024 à 0:03
Signaler
Disons que l'Etat a des outils pour empêcher des achats dans des domaines stratégiques, simplement nos dirigeants de la "start-up nation" ignorent que l'IA est stratégique. De plus Macron croit aveuglément à la loi du marché or les USA ont un marché...

à écrit le 26/02/2024 à 21:32
Signaler
Découvrirons-nous que certains détails importants ont été tenus secrets et que Mistral est une fraude un an plus tard, tout comme pour Qwant ?

à écrit le 26/02/2024 à 20:17
Signaler
Elle a coûté moitié moins cher en developpement, mais est-elle plus ou moins consommatrices de ressources en service client que chat-gpt?

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.