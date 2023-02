Au tour de Meta de lancer son intelligence artificielle générative, capable d'écrire des textes à partir de quelques consignes, comme le fait ChatGPT. Son nom ? LLaMA, comme l'animal, mais surtout comme le diminutif de Large Language Model Meta AI.

Contrairement à ChatGPT qui a été mis dans les mains du grand public en novembre, LLaMA ne sera dans un premier temps accessible qu'aux chercheurs issus du public ou de la société civile. Autrement dit, pour l'instant, Meta ne commercialise pas LLaMA, il se contente de le faire tester.

Un positionnement nécessaire pour Meta

Avec son partenariat avec le créateur de ChatGPT, OpenAi, Microsoft a réussi à prendre de vitesse ses concurrents. L'entreprise a déjà commencé à intégrer la technologie à son moteur de recherche Bing, son navigateur Edge, ou encore à sa suite de bureautique 365 (Word, Excel, Powerpoint...). Mais les contre-attaques s'organisent : Google a présenté sa réponse à ChatGPT, un outil nommé Bard, pour l'instant réservé à un nombre limité de testeurs, tandis que les géants chinois Baidu et Alibaba ont également dévoilé leurs cartes.

Meta devait donc aussi se positionner sur le sujet, d'autant plus que son directeur scientifique Yann Le Cun avait fait part de son agacement contre l'engouement autour de ChatGPT. Pour lui, Meta et au moins une douzaine d'autres entreprises seraient capables de créer un outil similaire. En jeu : la maison-mère de Facebook et Instagram doit conserver auprès des investisseurs son image d'experte de l'IA ,après un virage raté vers le métavers.

Meta affirme avoir de meilleures performances que la concurrence

Les modèles de langage existent depuis des années, mais ils gagnent sans cesse en puissance, à la fois par l'augmentation du nombre de paramètres qu'ils embarquent -c'est-à-dire le nombre de variables qu'ils analysent- et par les volumes de données sur lesquels ils sont entraînés. LLaMA compte 65 milliards de paramètres, mais il serait compétitif en termes de résultats avec les modèles de Google qui en comptent bien plus, d'après Meta. L'entreprise publie aussi des versions de son outil avec moins de paramètres pour gagner en vitesse de calcul et réduire la consommation de ressources. Mais elle affirme ainsi que la version de LLaMA à 13 milliards de paramètres a quand même de meilleures performances que GPT-3 (le modèle derrière ChatGPT).

En revanche, la démonstration de ces propos attendra. Pour commencer, il n'existe pour l'instant pas de standard pour déterminer la puissance et l'efficacité des IA génératives. Ensuite, LLaMA n'est pas prêt pour un déploiement public. « Des travaux de recherche supplémentaires sont nécessaires pour traiter les risques de partialité, de commentaires toxiques et d'hallucinations », précise Meta.

En ouvrant largement l'accès à son modèle aux chercheurs publics, l'entreprise va pouvoir profiter de leurs retours experts pour corriger les défauts de LLaMA, sans prendre de risque commercial ou de réputation. Google a récemment perdu plus de 5% en Bourse suite à une démonstration ratée de Bard, et Microsoft a dû effectuer plusieurs vagues de modifications sur Bing Chat, après que des utilisateurs aient réussi à le faire mentir et à le rendre agressif dans ses propos. Avec sa méthode, Meta prend des précautions supplémentaires, aux dépens d'un petit retard sur le marché.

