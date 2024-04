Meta avance ses premiers pions. Ce jeudi, l'entreprise présente ses deux premières déclinaisons de son modèle d'intelligence artificielle : Llama 8b et Llama 70b, le « b », faisant référence aux nombres de milliards de paramètres de l'IA, c'est-à-dire à sa taille. Grossièrement, plus un modèle est petit, plus il donnera ses résultats rapidement, et moins il sera cher à faire fonctionner.

À l'inverse, plus un modèle est grand, plus il pourra effectuer des tâches complexes, mais plus il coûtera cher à l'utilisation. Avec ces deux premiers modèles, Meta s'attaque à l'écosystème des modèles de petite taille (8b) et de moyenne taille (70b), se calquant ainsi sur la stratégie adoptée par Mistral ou Anthropic, qui déclinent leurs IA en trois tailles.

Mais pour voir la pleine puissance de Llama 3, il faudra encore patienter quelques mois. Dans son billet de blog, l'entreprise confirme qu'elle est en cours d'entraînement d'une version du modèle à 400 milliards de paramètres. C'est cette version qui ira jouer des coudes dans les classements de performances avec les meilleures références du marché, GPT-4 Turbo d'OpenAI et Claude 3 Opus de Anthropic.

Plus encore, il pourrait bouleverser l'écosystème : Meta a la particularité de proposer ces modèles en open source, avec une licence d'exploitation qui permet à quasiment n'importe quelle entreprise de les utiliser gratuitement, là où ses principaux concurrents développent des modèles propriétaires dont ils facturent l'exploitation. « Le plancher de performance imposé par les modèles open source monte constamment et la distance avec le plafond posé par les meilleurs modèles propriétaires se réduit très vite », mettait en garde la semaine dernière Joëlle Pineau, directrice de l'IA chez Meta, dans La Tribune.

Llama 3 déjà gratuit partout

Dans l'attente de la grande version de Llama 3, les modèles présentés aujourd'hui n'apportent pas de nouveaux cas d'usages par rapport à l'état de l'art. En revanche, d'après les tests présentés par l'entreprise dans son article, ils s'imposent comme les nouvelles références pour leur tailles respectives. Concrètement, ils devraient permettre d'adresser des cas d'usages existants à moindre coût et/ou avec de meilleurs résultats.

Les deux versions de Llama 3 sont d'ores et déjà accessibles pratiquement partout, que ce soit chez les fournisseurs de cloud (AWS, Microsoft Azure, Google Cloud, IBM Watson X...), les spécialistes de la donnée (Snowflake, Databricks) ou l'incontournable Hugging Face. C'est un des atouts de l'open source : elle permet à tous les acteurs de l'écosystème de s'approprier les modèles pour les proposer aux entreprises. Mais ces dernières peuvent aussi elle-même exploiter les modèles de Meta, à condition d'avoir les compétences pour développer les couches logicielles autour. En résumé, Llama 7b et Llama 70b sont des moteurs, mais il faut construire le reste de la voiture autour pour les exploiter dans des cas d'usages - ce que proposent de faire les partenaires de Meta précités.

Meta, futur numéro 1 de l'IA ?

Si le géant des réseaux se permet d'offrir gracieusement le fruit de son travail à l'inverse de OpenAI ou Anthropic, c'est parce qu'elle ne compte pas générer des revenus directement avec ses modèles d'IA, mais grâce à l'intégration de fonctionnalités d'IA dans ses produits (Facebook, Instagram, WhatsApp et la réalité virtuelle). Llama 3 nourrit d'ores et déjà Meta AI, un assistant concurrent de ChatGPT qui sera accessible directement dans les différentes plateformes du groupe. Mais l'outil, promu comme « le plus intelligent du marché » par son créateur, n'est pour l'instant pas disponible en France. En parallèle, l'open source est un argument de recrutement pour les meilleurs chercheurs, assurait Joelle Pineau.

Cette première démonstration de force de Llama 3 expose les ambitions de Meta et de son dirigeant Mark Zuckerberg dans l'IA. L'entreprise a investi dans un des (si ce n'est le) plus gros stock de GPU de Nvidia (les puces indispensables à l'entraînement des IA) au monde. Avec ses deux divisions de recherches consacrées au sujet, elle s'appuie un grand nombre d'experts parmi les plus réputés au monde à l'image de Joelle Pineau ou du Français Yann Le Cun. Meta a donc tous les atouts pour redevenir la référence de l'IA. La pression est désormais sur OpenAI, dont le prochain modèle GPT-5 n'en finit plus de se faire attendre...