Les IA coûtent affreusement cher et vont manquer de données : ce que révèle un rapport de Stanford

Quelles sont les grandes tendances de l'IA ? L'AI Index publié par l'Institute for Human-Centered Artificial Intelligence de l'université américaine, très attendu dans le secteur, a rendu ses conclusions le 15 avril. La septième édition de ce rapport note notamment l'explosion des coûts des modèles d'intelligence artificielle, l'obsolescence des benchmarks et une utilisation croissante de l'IA en science et en médecine. Tour d'horizon.

Marine Protais

17 Avr 2024, 10:25

C'est l'une des bibles de l'intelligence artificielle. Tous les ans depuis 2015, l'Institute for Human-Centered Artificial Intelligence de Stanford analyse les grandes tendances de l'intelligence artificielle. La dernière édition note une véritable explosion du secteur - en termes de nombre de modèles publiés (149 modèles de fondation en 2023, le double de 2022), de performance, mais aussi de coûts... Le rapport fait une estimation inédite des coûts d'entraînement, information rare dans le secteur. Cette course effrénée à la performance fait émerger de nouveaux défis : une possible pénurie de données, et des difficultés pour évaluer correctement les modèles.

On manque d'une évaluation standardisée des modèles, notamment sur les risques

Les performances des modèles croissent tellement rapidement que les benchmarks qui permettent de les mesurer deviennent vite obsolètes, pointe l'AI Index, publié le 15 avril par l'Université de Stanford. Les modèles parviennent à surpasser les humains sur les quelques tâches que mesurent les systèmes d'évaluation les plus courants comme la classification d'images, la compréhension de texte, mais ils continuent d'échouer à certaines tâches plus complexes - les mathématiques de haut niveau, l'organisation - moins bien mesurées par les benchmarks. Il y a dix ans les benchmarks servaient pendant au moins cinq à dix ans, aujourd'hui ils ne sont plus pertinents au bout de quelques années, explique le rédacteur en chef du rapport, Nestor Maslej, à Nature.

L'AI Index note par ailleurs que des benchmarks permettant d'évaluer les garde-fous mis en place par les modèles sont de plus en plus utilisés. Deux ont particulièrement la cote : TruthfulQA, qui mesure le niveau de confiance que l'on peut accorder aux réponses des IA, et RealToxicityPrompts, qui s'intéresse à la propension des modèles à produire des contenus toxiques. Le problème c'est que ces évaluations manquent d'uniformisation. Chacun juge son modèle à sa manière. « L'absence d'évaluation standardisée rend extrêmement difficile la comparaison systématique des limites et des risques des différents modèles d'IA », résume Nestor Maslej dans le New York Times.

📢 The #AIIndex2024 is now live! This year's report presents new estimates on AI training costs, a thorough analysis of the responsible AI landscape, and a new chapter about AI's impact on medicine and scientific discovery. Read the full report here: https://t.co/NHWDCyuzm3 pic.twitter.com/2a31hhHAGG
— Stanford HAI (@StanfordHAI) April 15, 2024

Les IA coûtent de plus en plus cher

Les performances atteignent des sommets... et les dépenses aussi. GPT-4, le grand modèle de langage qui alimente ChatGPT publié en mars 2023 par la société OpenAI, aurait nécessité un investissement de 78 millions de dollars. Le chatbot Gemini Ultra de Google, lancé quelques mois plus tard, en décembre 2023, aurait coûté 191 millions de dollars. Celui de Meta, Llama 2 - de plus petite taille que ses concurrents - n'aurait requis « que » 3,9 millions de dollars. À titre de comparaison, le premier « Transformers » (le nom donné à ces grands modèles), qui date de 2017, n'aurait demandé que 900 dollars pour son entraînement. C'est une information importante de ce rapport, car les données concernant les coûts d'entraînement restent très rares.

Pour faire ces estimations, Stanford s'est associée à Epoch AI, un institut de recherche. Cette hausse s'explique par le nombre croissant de données qu'ils doivent traiter et donc de la puissance de calcul nécessaire.

La montée en flèche du coût financier s'accompagne d'une consommation croissante d'énergie par ces systèmes, ainsi que de la quantité d'eau nécessaire pour refroidir les centres de données qui contribuent à leur fonctionnement, met également en avant l'AI Index. « Ces systèmes sont impressionnants, mais ils sont aussi très inefficaces », explique Nestor Maslej à Nature.

Pour accompagner ces coûts faramineux, le rapport note une forte progression des investissements privés dans l'IA générative (dans l'IA de manière générale ils ont plutôt tendance à baisser). Les investisseurs ont dépensé 25,2 milliards de dollars en 2023 dans ce domaine, près de 8 fois plus qu'en 2022.

Notons toutefois que cette tendance pourrait s'inverser dans les années à venir. Certains spécialistes s'accordent pour dire que les entreprises vont de plus en plus se tourner vers l'utilisation de petits modèles d'IA plus spécialisés et moins chers, qui ne seront que des déclinaisons des très grands modèles comme GPT-4 et Claude-3.

On risque de bientôt manquer de données

La grande pénurie de données : c'est une inquiétude croissante dans le monde de l'IA. Les meilleurs modèles à ce jour ont été entraînés sur le web tout entier ou presque, et ces données ne sont pas extensibles à l'infini. Epoch Institute estime qu'en 2026, les chercheurs pourraient arriver à court de données textuelles de haute qualité, et d'ici à deux décennies de données de basse qualité. Le rapport fait un zoom spécial sur cette problématique.

L'une des solutions à ce problèmes s'appelle « les données synthétiques », des textes et images créées par les IA elles-mêmes, qui servent de base d'entraînement. Une forme de cannibalisme numérique, autrement dit. Sauf que cette méthode n'est pas pleinement satisfaisante. Plusieurs études ont montré que les modèles entraînés sur des données synthétiques avaient tendance à rétrécir leurs champs de compétences.

Les États-Unis créent plus de modèles, et la Chine dépose le plus de brevets

Si l'on doutait encore de l'avance des États-Unis, le rapport de Stanford souligne à quel point leur domination est écrasante. Le pays est à l'origine de 51 modèles « notables ». Par ce terme, les auteurs désignent des modèles qui ont une influence dans l'écosystème de l'IA à l'instar de GPT-4 ou Claude d'Anthropic. L'Union européenne se situe loin derrière avec 21 de ces modèles, dont 8 tout de même en France, et la Chine en troisième position (15). En revanche, la Chine est le pays qui dépose le plus de brevets : 61,1 % du nombre total en 2022, loin devant les États-Unis (20,9 %).

Par ailleurs, le rapport souligne que le secteur privé est majoritairement à l'origine de nouveaux modèles, bien plus que la recherche universitaire. Ce qui n'était pas le cas il y a quelques années. Cette nouvelle tendance s'explique par l'architecture des nouveaux modèles qui réclament beaucoup de données et de puissance de calcul, que possèdent les grandes entreprises. Google est l'entreprise qui a sorti le plus de modèles en 2023, suivi de Meta (11) et de Microsoft (9).

L'open source gagne du terrain

Près des deux tiers des nouveaux modèles de fondation (les grands modèles de langage comme Mistral Large ou Llama 2) sont aujourd'hui en accès libre. N'importe qui peut accéder aux codes du programme et l'utiliser.

La part de l'open source est en augmentation de 38 % par rapport à 2022, observe l'AI Index. Toutefois, notons que ce n'est pas le cas du modèle de fondation le plus utilisé : GPT-4 et sa précédente version GPT- 3,5, le moteur de ChatGPT.

L'IA explose dans le domaine de la recherche scientifique

Pour la première fois, l'Université de Stanford a décidé de consacrer tout un chapitre de son rapport à l'utilisation de l'intelligence artificielle en science et en médecine. « En 2022, l'IA a commencé à faire progresser la découverte scientifique. Mais durant l'année 2023, ces avancées ont été encore plus significatives », écrivent les auteurs.

L'AI Index énumère certains modèles clés sortis en 2023 : GNoME, qui facilite le processus de découverte de matériaux, GraphCast, qui prédit les phénomènes météorologiques plus précisément, ou encore SynthSR, qui convertit les scans du cerveau en image haute résolution.

Sujets les + lus

Sujets les + commentés

Sénégal : le nouveau président veut renégocier les contrats miniers et pétroliers, accusés de léser le pays

Annulations de vols en pagaille malgré la levée de grève de dernière minute du syndicat majoritaire des contrôleurs aériens

Gros coup pour Airbus, la low cost indienne Indigo va acheter 100 Airbus A350 pour passer au long-courrier

Guerre en Ukraine : des pourparlers de paix sont actuellement inenvisageables, selon Moscou

Faute de concurrence, la dette française attire plus que jamais les investisseurs

Commentaires 7

Et la physique ? à écrit le 17/04/2024 à 20:46

Signaler

Effectivement, rapport très instructif ! Une lacune, tout de même : pourquoi évacuer la physique, comme une brique majeure ou comme un tout, des futures ‘usines’ à produire des données synthétiques ? A-t-elle au moins été envisagée ?Evaluée ? Le ...

gonzague à écrit le 17/04/2024 à 14:46

Signaler

Pour moi, nous en sommes qu'au début ! la question est effectivement de savoir surtout dans quels domaines les transformations seront les plus importantes, voir ou cela ne nécessitera plus la présence de l'humain. Ce qui est intéressant sur le sujet... Pour moi, nous en sommes qu'au début ! la question est effectivement de savoir surtout dans quels domaines les transformations seront les plus importantes, voir ou cela ne nécessitera plus la présence de l'humain. Ce qui est intéressant sur le sujet, se pose actuellement sur les évolutions dans la communication et la culture ou le sens demeure important. Par contre je ferais une différence entre culture et marketing pour la simple raison que l'empirisme de ce qui touche le marché n'est que question d'appréhender les aléas économiques et les causalités extérieurs, du coup la question est plus de savoir qui serait derrière pour extraire le meilleur même si il y a peu de cohérence entre la com et le market et l'histoire, ce qui est pour la culture sans doute plus important ! la question peut être entre les sciences humaines et les science mathématiques, mais il est évident aussi qu'un tas de métiers commencent a disparaitre, et ce n'est pas fini ! Sachant que dans pleins de domaine ou les données ne sont pas extractibles voir conservée par l'humain, ben l'outil fonctionne souvent en fonction des données existantes, mais dans l'ensemble c'est une évolution que par exemple les politiques au pouvoir connaissent, puisque les erreurs qu'ils commettent pour beaucoup s'explique par le fait d'être guidé par le génie logiciel l'ia et autres aides a la décision. Et puis ayant été dans deux techno aujourd'hui mondialisé, le fait que l'ordinateur n'avait pas l'incrémentation de stockage rationnel, ben seul l'individu parfois lui est détenteur car la négation des dirigeants quant a l'information ou aux données a simplement laisser la chose a ceux qui souhaitaient s'en emparer ! les logiques de délocalisation ayant fait flores, j'ai eu l'occasion finalement de disposer de techno de ceux qui par la financiarisation n'ont pas compris ce qu'ils avaient entre les mains ! tant mieux puisque l'idée par la suite sera que l'humain détienne aussi des données clefs est a mon avis l'un des éléments qui retardera quelque soit l'IA. (tout était papier il y a 25 ans, du coup la question sera plus la capacité d'avoir conservé les données que de l'intelligence humaine, mais pour autant, le matriciel est surtout dépendant de l'accès que vous en avez eu ! (je n'ai pas l'intention de donnée ce que j'ai pu voir ou comprendre, car ceux qui ont délocalisé ne pouvait le voir car ce ne sont pas eux qui étaient réellement les acteurs ! Alors que depuis 15 ans hors de la techno, ce que je peux constater y compris avec les IA, c'est que la donnée est essentiel dans le profilage matriciel. Le modèle du net n'est plus adapté a l'intérêt que peuvent avoir les personnes comme moi qui ont été devant des matrices techno, du coup le fait de ne pas valoriser l'humain, ben c’est e prix a payer sur la question des données ! (pour moi, cela m'a permit de voir des choses que je n'aurai jamais imaginé) mais a présent ayant compris le niveau de carotte, ben ouallou, nada ! Il faudra que les IA épluchent ce qu'il reste, a l'époque j'ai contacté des gens pour leur faire comprendre ce dont je disposais , mais la plupart s'intéressaient plus a la bourse qu'au savoir. Et bien maintenant, ils en prendrons conscience, mais sans moi ! j'ai pu l'appliqué dans le domaine artistique, mais je n'ai pas l'intention a présent de participer a ce qui sera essentiellement en France, un outil de sécurité et de contrôle des personnes ! autant laisser les ia faire leur chemin, comme l'humain dans un monde qui sera de plus en plus techno féodaliste, donc rien ne vaut mieux que garder le savoir plus que d'en attendre autre chose que les besoins de ceux qui n'avaient rien compris a l'époque !

Churchill à écrit le 17/04/2024 à 13:54

Signaler

Ben oui, des ingénieurs très forts en python font des classes sur des trucs ou ils ont eu 20 heures de cours, mais qu'ils ne comprennent pas trop...s'ils avaient suivi depuis le début on leur aurait parle de la dimension de vapnik, pour les risques....

Bref à écrit le 17/04/2024 à 11:40

Signaler

Encore un concentré de bêtise humaine pour en faire un dieu ! ;-)

Charlie à écrit le 17/04/2024 à 11:32

Signaler

Actuellement, le matériel pour l'I.A. est en pleine bulle, tout cela va encore durer un an maximum, et ca va se dégonfler comme la bulle Internet en 2000

Math à écrit le 17/04/2024 à 11:30

Signaler

On en reparle chez le radiologue, ou quand vous réglerez votre facture toujours trop cher de téléphone ou quand vous pesterez contre des cabinets de conseil toujours trop chers. Ah la la…

Dossier 51 à écrit le 17/04/2024 à 10:51

Signaler

"une utilisation croissante de l'IA en science et en médecine" Pour nous vendre plus de produits dont nous n'avons pas besoin. Bref des machines super performantes mais toujours pas intelligentes. Je sens que ça va être long... ^^

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

Informatique

Les IA coûtent affreusement cher et vont manquer de données : ce que révèle un rapport de Stanford

On manque d'une évaluation standardisée des modèles, notamment sur les risques

Les IA coûtent de plus en plus cher

On risque de bientôt manquer de données

Les États-Unis créent plus de modèles, et la Chine dépose le plus de brevets

L'open source gagne du terrain

L'IA explose dans le domaine de la recherche scientifique

Newsletter - Tech & Médias