Pourquoi les IA risquent de produire de plus en plus de charabia et d'images étranges

Marine Protais

Publié le 25 juillet 2024 à 14:47 - Mis à jour le 25 juillet 2024 à 15:39

Ce contenu est réservé aux abonnés La Tribune

Si on demande à une IA de représenter un chien, le modèle produira plus d'images de golden retrievers, car ce sont les chiens les plus représentés dans les banques d'images.

Image générée par IA avec Canva

Ajouter La Tribune à vos sources préférées

Les IA se nourrissent du Web, qui est envahi de contenus créés par les IA elles-mêmes. À long terme, cette autophagie pourrait aboutir à la production de contenus absurdes et de piètre qualité. C'est ce que démontre une étude publiée le 24 juillet dans la revue scientifique Nature.

Trop d'intelligence artificielle tue l'intelligence artificielle. Ainsi pourrait-on résumer (grossièrement) le concept de "model collapse" (en français l'effondrement des modèles). Ce phénomène, qui inquiète régulièrement l'industrie depuis quelques mois, vient d'être validé scientifiquement dans la revue Nature. Une étude publiée le 24 juillet démontre que si les modèles d'intelligence artificielle générative sont nourris avec trop de données produites elles-mêmes par des IA, ils finissent par produire du charabia et des images absurdes. Le problème concerne à la fois les grands modèles de langage (LLM) comme GPT-4 d'OpenAI ou Claude d'Anthropic, et les générateurs d'images tels que Stable Diffusion, Midjourney ou DALL-E.

À lire également

Comment cette dégénérescence s'opère ? Pour comprendre le processus, il faut rappeler que les modèles d'IA produisent du contenu de manière probabiliste. Et ils ont tendance à sur-représenter les images ou les mots fréquents, et à sous-estimer ceux qui sont moins récurrents. Ce problème s'amplifie au fur et à mesure. Imaginez que l'on demande à une IA de représenter un chien. Le modèle produira plus d'images de golden retrievers, car ce sont les chiens les plus représentés dans les banques d'images, et moins de dalmatiens ou d'autres races moins répandues. Si ensuite ce même modèle est entraîné sur les images qu'il a produites, il représentera encore plus de golden retrievers. C'est la première étape de l'effondrement. Les chercheurs l'appellent « la perte de variance ». Et au fur et à mesure des entraînements, le modèle produit des golden retrievers à l'anatomie aléatoire, expliquent les chercheurs canadiens et britanniques à l'origine de l'étude. Car en plus de sur-représenter certaines races, l'IA introduit des erreurs.

A LIRE AUSSI

Les nazis et Vikings noirs de Gemini ou comment Google s'est raté dans la gestion des biais de l'IA

Marine Protais

Diversité dans la tech : le programme Tremplin supprimé par la Mission French Tech

Sacrifié sur l'autel des restrictions budgétaires et considéré comme pas assez efficace, le programme Tremplin, qui devait favoriser la diversité sociale et culturelle dans le milieu très blanc et masculin de la tech, s'arrêtera en juin 2027. Un nouveau programme baptisé Nova, moins coûteux et centré sur le scale-up, prendra la relève.

Start-up

Climat : l’IA fait exploser les émissions carbone de Google et d’Amazon

Google a rejeté 18,8 millions de tonnes équivalent CO2 en un an (+82 % depuis 2019), Amazon 80,85 millions (+58 %). Les deux groupes polluent désormais plus par dollar de revenu généré, une première pour Amazon depuis 2021, malgré leurs promesses de neutralité carbone.

Intelligence Artificielle

Spectateurs assistant au lancement d'une fusée transportant des satellites pour la constellation Amazon Leo.

Amazon Leo : la justice française rejette le recours contre le service de connexion à Internet par satellite

Le Conseil d'État n'a pas suivi le syndicat CFE-CGC qui contestait l'autorisation d'émettre en France accordée au géant américain. Le service pourra donc être lancé d'ici la fin de l'année dans notre pays.

Télécoms

François Bonnetblanc, chercheur de l’Institut National de Recherche en Informatique et en Automatique (INRIA), à l’Université de Montpellier.

Cancer : une cartographie du cerveau en temps réel pour guider la chirurgie

Une cartographie inédite du cerveau, mise au point par des chercheurs, est capable de fournir une sorte de « GPS » et ainsi d'orientier le neurochirurgien en temps réel pendant l’opération d'ablation d'une tumeur cérébrale. Objectif : gagner en précision et limiter les risques d’affecter les capacités cognitives et motrices du patient.

Tech & IA

Marine Tondelier, secrétaire nationale des Ecologistes (Europe Ecologie Les Verts)

Data centers, marché de la donnée : les Écologistes présentent leur vision de l'IA et du numérique

L'intelligence artificielle s'imposera sans doute comme l'un des thèmes de la campagne présidentielle. Les écologistes se saisissent du sujet en présentant « un carnet de doctrine » sur le numérique, dont les maîtres mots sont de réduire le gigantisme et de favoriser la « technodiversité ».

Tech & IA

Meta a annoncé lundi la mise en place progressive dans le monde entier de sa messagerie WhatsApp.

WhatsApp : pourquoi l'Inde s'oppose au remplacement des numéros de téléphone par des pseudos

Meta a annoncé lundi la mise en place progressive dans le monde entier d'une nouvelle évolution dite de « confidentialité » de sa messagerie WhatsApp. Le gouvernement indien s'en est ouvertement inquiété dans un courrier ce jeudi.

Tech & IA

Torsten Slok affirme que " le retour sur investissement de l'IA pourrait être long en dehors du secteur technologique ".

Catastrophe pour l'emploi ou krach financier : pourquoi l'histoire de l'IA finira mal

Torsten Slok, économiste en chef chez Apollo, a présenté deux scénarios pour l'IA lors du Forum annuel sur les banques centrales, à Sintra (Portugal). Soit elle remplacera des emplois, soit elle ne tiendra pas ses promesses pour les investisseurs.

Intelligence Artificielle

STMicroelectronics semi-conducteurs wafers

Semi-conducteurs : pourquoi la plus grande menace pour l'Europe n'est pas celle qu'on croit

Risques de limitations de nos importations par la Chine et les États-Unis, conflits armés sur les lieux de production mais aussi faiblesses internes du marché européen, les professionnels du secteur des semi-conducteurs et instituts de recherche voient les nuages s’accumuler au-dessus de nos têtes.

Intelligence Artificielle

Pourquoi les IA risquent de produire de plus en plus de charabia et d'images étranges

Sur le même sujet

Diversité dans la tech : le programme Tremplin supprimé par la Mission French Tech

Climat : l’IA fait exploser les émissions carbone de Google et d’Amazon

Amazon Leo : la justice française rejette le recours contre le service de connexion à Internet par satellite

Cancer : une cartographie du cerveau en temps réel pour guider la chirurgie

Data centers, marché de la donnée : les Écologistes présentent leur vision de l'IA et du numérique

WhatsApp : pourquoi l'Inde s'oppose au remplacement des numéros de téléphone par des pseudos

Catastrophe pour l'emploi ou krach financier : pourquoi l'histoire de l'IA finira mal

Semi-conducteurs : pourquoi la plus grande menace pour l'Europe n'est pas celle qu'on croit

Sur le même sujet

Diversité dans la tech : le programme Tremplin supprimé par la Mission French Tech

Climat : l’IA fait exploser les émissions carbone de Google et d’Amazon

Amazon Leo : la justice française rejette le recours contre le service de connexion à Internet par satellite

Cancer : une cartographie du cerveau en temps réel pour guider la chirurgie

Data centers, marché de la donnée : les Écologistes présentent leur vision de l'IA et du numérique

WhatsApp : pourquoi l'Inde s'oppose au remplacement des numéros de téléphone par des pseudos

Catastrophe pour l'emploi ou krach financier : pourquoi l'histoire de l'IA finira mal

Semi-conducteurs : pourquoi la plus grande menace pour l'Europe n'est pas celle qu'on croit