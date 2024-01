Alors que 2023 a été l'année de l'éclosion de l'intelligence artificielle générative, 2024 devrait être celle de la confirmation. Les entreprises stars de l'IA ont récupéré des financements colossaux pour développer des modèles de langage toujours plus puissants, mais doivent désormais passer au concret.

Le raz-de-marée a déjà commencé : les constructeurs de produits électroniques embarquent l'IA générative partout, aidés par la baisse vertigineuse de ses coûts de fonctionnement. Et puisque l'IA générative s'installe de plus en plus dans les usages, la question de ses conséquences sur l'emploi devrait prendre de plus en plus de place. L'année 2024 devrait donc enfin faire entrer l'IA générative dans le concret pour les entreprises et la société. Mais la révolution technologique n'a pas atteint son plateau, loin de là : le très attendu GPT-5 de OpenAI pourrait même remettre un énorme coup d'accélérateur.

L'IA générative embarquée partout

De l'IA générative dans les smartphones, de l'IA générative dans les ordinateurs, de l'IA générative dans des lave-linge et des réfrigérateurs et même des appareils dédiés à l'IA générative.

Le raz-de-marée a déjà commencé au CES de Las Vegas, la grande messe annuelle de la tech, et c'est une évolution importante. Car jusqu'ici, la grande majorité des outils d'IA générative, à l'instar de ChatGPT, faisaient appel au cloud. Autrement dit, les commandes de l'utilisateur sont envoyées sur un serveur à distance, dans un datacenter, où le modèle d'IA va tourner puis renvoyer une réponse. Ce système pose plusieurs problèmes : pour commencer, impossible d'utiliser l'outil sans connexion internet. Ensuite, dépendre du cloud signifie faire sortir les données de son appareil, avec les risques de sécurité des données qui y en découlent. En intégrant directement les fonctionnalités d'IA dans les appareils, les constructeurs résolvent deux problèmes en un.

Le cabinet d'analyse Canalys s'attend ainsi à ce qu'un PC sur cinq vendu en 2024 embarque un processeur dédié aux tâches d'intelligence artificielle. Soit plus de 170 millions d'ordinateurs capables de faire tourner des IA génératives sans connexion internet, à l'image du Lenovo Thinkpad X1, lancé en décembre.

Même stratégie chez les constructeurs de smartphones. Mercredi, Samsung a présenté ses derniers smartphones haut de gamme, les Galaxy S24, qui embarquent désormais des assistants d'IA générative sur plusieurs applications. De quoi relancer leur croissance en berne ?

Si les constructeurs cherchent tous à intégrer l'IA générative, d'autres veulent aller plus loin et créer des appareils dédiés, des sortes d'« iPhone de l'IA générative ». Phénomène du CES 2024, Rabbit R1 en est un bon exemple. Ce gadget à 199 dollars, relié au smartphone de l'utilisateur, est capable de faire des actions comme commander une pizza ou réserver un vol. Ses 10.000 premiers exemplaires se sont écoulés en moins de 24 heures, malgré qu'il ne sorte pas avant le mois de mai.

Avant lui, la startup Humane AI (financée à plus de 200 millions de dollars) a présenté son Pin, un petit appareil à attacher à sa veste, vendu au prix rondelet de 699 dollars. Censé remplacer le smartphone, l'appareil peut être commandé par la voix et se dote d'une caméra. Mais les retours des premiers testeurs restent mitigés. Ces deux appareils illustrent toutefois les ambitions d'un secteur de l'électronique à la recherche du « next big thing ».

Une chute drastique du coût de l'IA générative

Dans un article publié en octobre 2023, le Wall Street Journal affirmait que Copilot, le pionnier des assistants d'IA générative nourri par les modèles d'OpenAI, faisait perdre à GitHub en moyenne 20 dollars par mois et par utilisateur. En cause ? L'abonnement -à 10 dollars par mois pour le grand public et à 19 dollars par mois pour la version entreprise- ne couvrait pas le coût élevé du fonctionnement de l'outil, capable de proposer du code informatique en temps réel aux développeurs.

Malgré cette situation, le modèle de paiement par abonnement -plutôt qu'au volume de requête- a été choisi par de nombreux services d'IA, à l'instar de ChatGPT Plus. Microsoft a même décidé de généraliser le modèle Copilot à tous ses logiciels et d'en faire un pilier stratégique de l'entreprise.

Autrement dit, une partie significative du secteur mise sur une situation où le client paie un coût fixe quel que soit son volume d'usage de l'IA. Mais pour que ce modèle devienne viable, le coût de fonctionnement des IA doit rapidement baisser.

Bonne nouvelle : les experts s'accordent pour dire que c'est le cas, et à une vitesse jamais vue dans l'histoire de la tech. Invité jeudi dernier au podcast Unconfuse me de Bill Gates, le dirigeant d'OpenAI Sam Altman explique ainsi que son entreprise a divisé par 40 le coût de fonctionnement de GPT-3 depuis sa sortie en juin 2020, et par 10 celui de GPT-3.5, sorti en mars 2022. « Je pense que nous observons la courbe de réduction des coûts la plus pentue de l'histoire des technologies », s'enthousiasme-t-il au micro du célèbre milliardaire. Altman va même jusqu'à projeter « un coût proche de zéro » à moyen terme pour le fonctionnement des grands modèles d'IA.

Pour y parvenir, le secteur utilise trois principaux leviers : l'optimisation des modèles d'IA existants par leurs développeurs ; la création de modèles spécialisés, plus petits et plus efficaces sur des tâches précises ; et enfin, l'arrivée de processeurs plus performants.

Sur ce dernier point, le directeur technique de AWS France, Stephan Hadinger, expliquait à La Tribune lors de l'événement AI Marseille, fin novembre, que chez le numéro un du marché du cloud, la nouvelle génération de processeurs maison (Graviton) dédiés au fonctionnement des IA [aussi appelé l'inférence, ndlr], permettait déjà de réduire les coûts par deux. Google avec ses processeurs TPU, Microsoft ou encore Nvidia s'engagent aussi dans la même voie.

La réduction de la facture passe aussi par un usage plus raisonné des modèles. Selon un principe simple : pourquoi faire appel à une IA dernier cri, quand un modèle plus ancien et mieux optimisé suffit à accomplir la tâche ? Avec plus de 470.000 modèles hébergés sur la plateforme Hugging Face, les développeurs ont de quoi faire. « Ma prédiction est qu'en 2024 la plupart des entreprises vont réaliser que l'usage de modèles plus petits, moins chers et plus spécialisés a plus de sens dans 99% des cas d'usages de l'IA », se projette ainsi Clément Delangue, cofondateur et directeur général de l'entreprise.

Les premières conséquences sociales de l'IA sur le travail

Si l'intelligence artificielle générative plaît autant aux dirigeants, c'est notamment parce qu'elle fait miroiter des gains de productivité inédits. Parmi les premiers exemples chiffrés, Microsoft rapporte que les primo-utilisateurs de son assistant d'IA Copilot pour Microsoft 365 (la suite bureautique avec Excel, Word, Powerpoint...) estiment économiser en moyenne plus d'une heure de travail par semaine. Et ce n'est qu'un début.

Une question va rapidement se poser aux dirigeants : que faire de ces gains de productivité ? Faut-il garder une production constante avec des ressources moindres, synonyme de licenciements mais aussi de meilleures marges ? C'était l'idée de l'entreprise Onclusive à l'automne dernier, qui a décidé de se débarrasser de 217 salariés spécialisés dans la veille médiatique, pour les remplacer par une IA générative. Depuis, ce nombre a été réduit à 157 suppressions nettes en comptant les créations d'emplois pour accompagner le logiciel, mais il représente près de la moitié des effectifs de la branche française de l'entreprise.

Sans aller jusqu'à l'extrême du remplacement des salariés par l'IA, plusieurs secteurs comme l'e-commerce, le marketing ou encore la relation client commencent déjà à être profondément transformés.

Faut-il alors revoir l'organisation et la définition des métiers, pour concentrer les capacités humaines sur les tâches créatives, à plus haute valeur ajoutée ? C'est tout du moins le discours tenu par les développeurs des IA comme Microsoft, Google ou encore Nvidia. Selon eux, l'intelligence artificielle se contenterait d'accomplir les tâches rébarbatives, et serait presque libératrice pour les travailleurs. Mais reste à voir ce que vont devenir les nombreux emplois d'exécutants, dans lesquels la prise d'initiative est limitée. « Pour l'instant, les clients ne parlent pas de licenciement. Il se demandent plutôt comment ils doivent recruter différemment pour prendre la vague de l'IA », constate Fabrice Asvazadourian, directeur général du cabinet de conseil Sopra Steria Next.

Plus généralement, la question des conséquences de l'IA sur le marché du travail s'est à peine installée dans le débat public en 2023, et devrait fatalement y faire irruption cette année. Le comité interministériel de l'intelligence artificielle, missionné au mois de septembre par Matignon, devrait rendre son rapport en avril et poser des bases.

« Ce qui est effrayant avec l'IA, ce n'est pas le changement en lui-même. C'est la vitesse inédite à laquelle la société et le marché du travail vont devoir s'adapter », diagnostique Sam Altman dans son entretien avec Bill Gates.

GPT-5, un nouveau boom dans l'IA générative ?

En novembre, lors de sa première conférence annuelle, OpenAI a confirmé qu'il travaillait sur GPT-5, une nouvelle itération de son modèle d'intelligence artificielle le plus puissant, sans donner de date de sortie. La version actuelle, GPT-4, déployé en mars 2023, a dans le même temps reçu une amélioration sous le nom « GPT-4 Turbo ». Reçu à de nombreuses conférences et tables rondes, Sam Altman a laissé entendre que non seulement, GPT-5 améliorerait grandement les performances du modèle, mais qu'en plus, il rapprocherait grandement l'entreprise de l'AGI (Artificial General Intelligence), cette IA « ultime » capable de reproduire le fonctionnement d'un cerveau humain, et même d'en dépasser les capacités. Puis il a ajouté cette semaine que la sortie de GPT-5 est la plus grande priorité de l'entreprise.

Est-ce suffisant que GPT-5 soit disponible dès 2024 ? Difficile à dire. OpenAI a attendu seulement un an entre la sortie de GPT-2 (en février 2019) et celle de GPT-3 (en juillet 2020), puis près de trois ans entre GPT-3 et GPT-4. Cette dernière mise à jour à transformé GPT en modèle multimodal, capable d'appréhender et de générer des images en plus du texte. GPT-5 devrait s'engouffrer dans cette direction --avec l'intégration de la voix notamment. OpenAI a donc plus que jamais l'opportunité de creuser l'écart avec la concurrence, et devrait être tenté de s'en saisir.

Gemini, le modèle de Google qui devait s'imposer comme le nouveau standard du secteur, est sorti plus tard que prévu, avec au final des performances proches de celles de GPT-4. Quant au reste de la concurrence, à l'instar de Anthropic, Inflection ou Mistral, elle garde plusieurs wagons de retard. OpenAI a donc tout intérêt à sortir GPT-5, à moins qu'il soit encore gardé au chaud pour des raisons de sécurité...

