Microprocesseurs : qui remportera la bataille de l'IA ?

Guillaume Renouard

Publié le 31 mai 2024 à 04:33

Ce contenu est réservé aux abonnés La Tribune

Jensen Huang, patron de Nvidia.

Nvidia

Ajouter La Tribune à vos sources préférées

Le déploiement de l’IA générative dans les entreprises va nécessiter des puces informatiques d’un autre genre que celles qui sont actuellement utilisées pour entraîner ces modèles, avec de gros enjeux autour des coûts et de la vitesse d’exécution. Les fabricants de microprocesseurs commencent à se positionner sur ce marché qui sera bientôt plus gros que celui des puces d’entraînement.

L'annonce a été quelque peu éclipsée : elle n'a pourtant rien d'anodin. En mars dernier, alors qu'il annonçait sa nouvelle génération de microprocesseurs Blackwell, surpuissants et taillés pour l'entraînement de modèles d'IA de pointe, le dirigeant de Nvidia, Jensen Huang, évoquait également l'ajout d'un nouveau service à sa suite logicielle.

Baptisé NIM, pour Nvidia Inference Microservice, il vise à aider les entreprises à tirer le maximum de leurs GPUs Nvidia issues des générations précédentes pour utiliser l'intelligence artificielle (IA) au quotidien.

Qu'est-ce que l'inférence ?

Dans le monde de l'IA, l'inférence correspond au processus qu'un modèle d'apprentissage automatique déjà entraîné utilise pour tirer des conclusions à partir de nouvelles données. Il s'agit en somme, pour une entreprise, de faire tourner un algorithme d'IA pour répondre à des cas d'usage concrets. L'inférence fait suite à l'entraînement, le processus qui consiste à nourrir un modèle d'immenses quantités de données jusqu'à ce qu'il parvienne à accomplir une tâche spécifique. OpenAI a par exemple dû longuement entraîner ChatGPT avant de le faire découvrir au grand public.

Mais lorsqu'une entreprise utilise ChatGPT pour construire un chatbot chargé de faire du service client, elle n'a pas besoin de réentraîner le modèle. Elle va simplement recalibrer celui-ci pour qu'il fonctionne sur un socle de données plus restreint, celui de l'entreprise, et le faire tourner pour répondre aux questions des clients. Presque toutes les applications de l'IA dans le monde réel s'appuient donc sur l'inférence.

Tech & IA

Chaque jour à 13h, l’essentiel de l’actualité tech.

Guillaume Renouard

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

Introduite en Bourse il y a deux semaines, l'action SpaceX a déjà perdu près de 900 milliards de dollars de valeur depuis son pic. En cause, des dépenses colossales dans l'intelligence artificielle, des pertes qui s'accumulent et des investisseurs qui doutent désormais d'une valorisation jugée excessive.

Tech & IA

Le dévéloppement de GTA VI aurait coûté d'après les analystes entre 1 et 2 milliards de dollars.

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

Une boite pour le jeu vidéo le plus attendu de l'année, Grand Theft Auto VI, sera potentiellement en vente en novembre, mais elle sera vide de tout disque. En supprimant le circuit physique, Rockstar élimine une part du prix absorbé par les intermédiaires et oriente l'essentiel des revenus vers les plateformes numériques.

Tech & IA

ChatGPT proposera désormais trois versions différentes de son agent conversationnel pour des usages spécifiques.

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

OpenAI a présenté sa nouvelle famille de modèles GPT-5.6, censé être plus puissante et moins chère que la précédente. Son déploiement est soumis à l'approbation du gouvernement américain, tout comme celui du concurent Anhtropic.

Tech & IA

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Peu après son blocage d'urgence, le modèle d'IA Mythos 5 d'Anthropic pourra de nouveau être utilisé par une poignée de groupes américains Le gouvernement l'avait interdit mi-juin, craignant qu'il ne puisse être détourné à des fins offensives par des acteurs malveillants.

Tech & IA

Mirendil ambitionne d’automatiser la recherche en IA

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Forte d’une levée de fonds de 200 millions de dollars et d'une équipe issue d'Anthropic, Mirendil développe des modèles capables d’automatiser la recherche en IA pour les équipes de recherche des entreprises. Un nouveau signe du succès des « néolabs », cette génération émergente d’entreprises d’IA qui s’attaquent à des problèmes que les éditeurs généralistes ne creusent pas.

Intelligence Artificielle

Course aux puces IA : IBM vise un saut technologique à 0,7 nm

IBM affirme avoir mis au point une nouvelle architecture de semi-conducteurs qui pourrait, à l’horizon de cinq ans, ouvrir la voie à des puces « 0,7 nm » offrant 50 % de puissance en plus.

Tech & IA

L'équipe de la start-up bordelaise Haiku spécialiste de l'IA appliquée aux métiers du droit.

Intelligence artificielle : Haiku se finance pour équiper les avocats et professions juridiques

La start-up bordelaise Haiku, spécialiste de l'intelligence artificielle appliquée au droit, a bouclé un deuxième tour de table de trois millions d’euros. Alors qu’elle revendique 5 000 utilisateurs, elle entend accélérer en France et se déployer en Europe sur le marché ultra-concurrentiel des métiers juridiques.

Tech & IA

Le logiciel repose uniquement sur des solutions développées en interne d’après le fondateur de YesWeHack.

Le normand YesWeHack déploie des agents IA capables de pirater les systèmes pour les protéger

La société normande, connue pour ses programmes de piratage éthique, déploie des agents capables d’attaquer les systèmes informatiques d’une entreprise comme le ferait un hackeur.

Tech & IA

Microprocesseurs : qui remportera la bataille de l'IA ?

Qu'est-ce que l'inférence ?

Tech & IA

Sur le même sujet

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Course aux puces IA : IBM vise un saut technologique à 0,7 nm

Intelligence artificielle : Haiku se finance pour équiper les avocats et professions juridiques

Le normand YesWeHack déploie des agents IA capables de pirater les systèmes pour les protéger

Qu'est-ce que l'inférence ?

Tech & IA

Sur le même sujet

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Course aux puces IA : IBM vise un saut technologique à 0,7 nm

Intelligence artificielle : Haiku se finance pour équiper les avocats et professions juridiques

Le normand YesWeHack déploie des agents IA capables de pirater les systèmes pour les protéger