Meta a publié ce jeudi les deux premiers membres de sa famille de modèles d'intelligence artificielle Llama 3 : un de petite taille et un de taille moyenne. Pour le très grand modèle, a priori capable de rivaliser voire de dépasser les performances des meilleurs IA d'OpenAI, Google ou Anthropic, il faudra encore patienter quelques mois. Mais cet avant-goût laisse déjà entrevoir la puissance de feu de l'entreprise de Mark Zuckerberg.
Meta avance ses premiers pions. Ce jeudi, l'entreprise présente ses deux premières déclinaisons de son modèle d'intelligence artificielle : Llama 8b et Llama 70b, le « b », faisant référence aux nombres de milliards de paramètres de l'IA, c'est-à-dire à sa taille. Grossièrement, plus un modèle est petit, plus il donnera ses résultats rapidement, et moins il sera cher à faire fonctionner.
À l'inverse, plus un modèle est grand, plus il pourra effectuer des tâches complexes, mais plus il coûtera cher à l'utilisation. Avec ces deux premiers modèles, Meta s'attaque à l'écosystème des modèles de petite taille (8b) et de moyenne taille (70b), se calquant ainsi sur la stratégie adoptée par Mistral ou Anthropic, qui déclinent leurs IA en trois tailles.
Mais pour voir la pleine puissance de Llama 3, il faudra encore patienter quelques mois. Dans son billet de blog, l'entreprise confirme qu'elle est en cours d'entraînement d'une version du modèle à 400 milliards de paramètres. C'est cette version qui ira jouer des coudes dans les classements de performances avec les meilleures références du marché, GPT-4 Turbo d'OpenAI et Claude 3 Opus de Anthropic.
Plus encore, il pourrait bouleverser l'écosystème : Meta a la particularité de proposer ces modèles en open source, avec une licence d'exploitation qui permet à quasiment n'importe quelle entreprise de les utiliser gratuitement, là où ses principaux concurrents développent des modèles propriétaires dont ils facturent l'exploitation. « Le plancher de performance imposé par les modèles open source monte constamment et la distance avec le plafond posé par les meilleurs modèles propriétaires se réduit très vite », mettait en garde la semaine dernière Joëlle Pineau, directrice de l'IA chez Meta, dans La Tribune.
Dans l'attente de la grande version de Llama 3, les modèles présentés aujourd'hui n'apportent pas de nouveaux cas d'usages par rapport à l'état de l'art. En revanche, d'après les tests présentés par l'entreprise dans son article, ils s'imposent comme les nouvelles références pour leur tailles respectives. Concrètement, ils devraient permettre d'adresser des cas d'usages existants à moindre coût et/ou avec de meilleurs résultats.
Newsletter
Tech & IA
Chaque jour à 13h, l’essentiel de l’actualité tech.