• La Tribune
  • La Tribune Dimanche
  • La Tribune Afrique
  • Air&Cosmos
  • |
  • Événements
  • L'instant Sélection
Une du journal La Tribune

Dernière édition

Flèche menu déroulant
Newsletters
Logo La Tribune
  • Économie
  • Finance
  • Tech & IA
  • Énergie & industrie
  • Transports
  • Défense & aérospatiale
  • Climat
Logo La Tribune
  • Économie
  • Finance
  • Tech & IA
  • Énergie & industrie
  • Transports
  • Défense & aérospatiale
  • Climat

Sélectionnez votre région

Logo La Tribune

RECHERCHER

Loupe

LTD
La Tribune Dimanche
Ouvrir dans une nouvelle fenêtre
Air&Cosmos icon
Air&Cosmos
Ouvrir dans une nouvelle fenêtre

À la une
  • Finances publiques
  • Fiscalité
  • Immobilier
  • Consommation
  • Distribution
  • Politique internationale
  • Finances personnelles
  • Banque & assurances
  • Marchés financiers
  • Intelligence artificielle
  • High tech
  • Télécoms
  • Start-up
  • Énergie
  • Politique industrielle
  • Chimie & pharmacie
  • Automobile
  • Mobilités
  • Aéronautique
  • Défense
  • Spatial
  • Environnement
  • Agriculture & agroalimentaire
Idées & débats
Kiosque numériqueNewsletters
La Tribune DimancheLa Tribune AfriqueAir&Cosmos
  • La Tribune Now
  • Votre argent avec Finance Héros
  • Construire les mobilités de demain
  • Fonction Finance 2.0 avec Cegid
  • Transformations durables avec Forvis Mazars
  • Accélérer avec le Cloud par AWS
  • Fisher Investments
  • Au coeur du business
  • VisionAir avec Bpifrance
  • Adaptabilité permanente : Le pouvoir d’agir avec IBM Consulting
  • Succès d'entreprises avec Deloitte
  • L'Œil sur vos Finances
  • Les Rencontres de Roissy Meaux Aéropôle
  • France Travail accompagne le Salon des Maires
  • La CCI Paris Ile-de-France, le réflexe des entrepreneurs
  • #La Tribune Business Interviews
  • #La Tribune Business Dossiers
  • #La Tribune Business TV
  • Instant Sélection
Événements
Technos & MediasElectronique

Microprocesseurs : qui remportera la bataille de l'IA ?

Guillaume Renouard

Publié le 31 mai 2024 à 04:33

Premium

Ce contenu est réservé aux abonnés La Tribune

Jensen Huang, patron de Nvidia.

Jensen Huang, patron de Nvidia.

Nvidia

Le Quotidien Numérique

27 juin 2026

Photo d'illustration de l'article
LireS'abonner

Les plus lus

  • 1

    SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

  • 2

    Charles Wolf, directeur général de Sanofi France : « Les États-Unis siphonnent les investissements »

  • 3

    Dette publique : « Tout se met en place pour être progressivement étranglé », prévient Anthony Morlet-Lavidalie, économiste chez Rexecode

  • 4

    « La mortalité explose comme en 2003 » : face à la canicule historique de juin, la crainte d'une hécatombe

  • 5

    OPINION. « Desserrer la tenaille RN-LFI », par Gabriel Attal ancien Premier ministre

  • 6

    Canicule : le gouvernement va prolonger les soldes d'été

Régions

  • Auvergne-Rhône-Alpes
  • Bourgogne-Franche-Comté
  • Bretagne
  • Centre-Val de Loire
  • Corse
  • Grand Est
  • Hauts-de-France
  • Île-de-France
  • Normandie
  • Nouvelle-Aquitaine
  • Occitanie
  • Pays de la Loire
  • Provence-Alpes-Côte d'Azur

La Tribune +

  • Espace abonné
  • Kiosque numérique
  • Annonces légales
  • Déposer vos annonces légales

Services

  • Supplément
  • La Tribune now

Evénements

  • ACT50
  • Aéroforum
  • AIM
  • Bordeaux Solar Summit
  • Family & Business Forum
  • Forum Europe Afrique
  • Impacts Santé
  • Les Lauréates
  • Paris Air Forum
  • Sommet Aéronautique & Spatial de Bordeaux
  • Sommet Économique de la Corse
  • Tech For Future
  • World News Media Congress
  • Tous nos événements en régions

Pour gérer vos consentements,

Suivez-nous sur les réseaux sociaux

YouTube
LinkedIn
Facebook
Instagram
X

Application mobile

App Store
Google Play

  • Nous Contacter
  • Charte d'indépendance et de déontologie
  • Mentions Légales
  • CGU
  • CGU Pro
  • Gestion des cookies
  • Exercez vos droits
  • Politique de confidentialité

Droits de reproduction et de diffusion réservés @LaTribune

Partenaire digital de confiance - Certification de qualité
  • La Tribune
  • La Tribune Dimanche
  • La Tribune Afrique
  • Air&Cosmos
  • |
  • Événements
  • L'instant Sélection
Google icon
Ajouter La Tribune à vos sources préféréesAjouter La Tribune à vos sources préférées
Le déploiement de l’IA générative dans les entreprises va nécessiter des puces informatiques d’un autre genre que celles qui sont actuellement utilisées pour entraîner ces modèles, avec de gros enjeux autour des coûts et de la vitesse d’exécution. Les fabricants de microprocesseurs commencent à se positionner sur ce marché qui sera bientôt plus gros que celui des puces d’entraînement.

L'annonce a été quelque peu éclipsée : elle n'a pourtant rien d'anodin. En mars dernier, alors qu'il annonçait sa nouvelle génération de microprocesseurs Blackwell, surpuissants et taillés pour l'entraînement de modèles d'IA de pointe, le dirigeant de Nvidia, Jensen Huang, évoquait également l'ajout d'un nouveau service à sa suite logicielle.

Baptisé NIM, pour Nvidia Inference Microservice, il vise à aider les entreprises à tirer le maximum de leurs GPUs Nvidia issues des générations précédentes pour utiliser l'intelligence artificielle (IA) au quotidien.

Qu'est-ce que l'inférence ?

Dans le monde de l'IA, l'inférence correspond au processus qu'un modèle d'apprentissage automatique déjà entraîné utilise pour tirer des conclusions à partir de nouvelles données. Il s'agit en somme, pour une entreprise, de faire tourner un algorithme d'IA pour répondre à des cas d'usage concrets. L'inférence fait suite à l'entraînement, le processus qui consiste à nourrir un modèle d'immenses quantités de données jusqu'à ce qu'il parvienne à accomplir une tâche spécifique. OpenAI a par exemple dû longuement entraîner ChatGPT avant de le faire découvrir au grand public.

Mais lorsqu'une entreprise utilise ChatGPT pour construire un chatbot chargé de faire du service client, elle n'a pas besoin de réentraîner le modèle. Elle va simplement recalibrer celui-ci pour qu'il fonctionne sur un socle de données plus restreint, celui de l'entreprise, et le faire tourner pour répondre aux questions des clients. Presque toutes les applications de l'IA dans le monde réel s'appuient donc sur l'inférence.

À lire également

  • Semi-conducteurs : Micron va construire deux usines aux Etats-Unis en échange d'une subvention colossale
  • Bataille des semi-conducteurs : la Chine investit plus de 40 milliards d'euros
  • Semi-conducteurs : boostées par l’IA, les ventes du géant taïwanais TSMC s’envolent
  • Semi-conducteurs : comment le géant indien Tata veut entrer dans l’arène
  • Propulsé par l'IA, Nvidia poursuit sa folle lancée au premier trimestre

Comme l'écrit Mike Demler, analyste indépendant spécialisé dans l'industrie des puces informatiques, l'entraînement sans l'inférence « serait comme construire une voiture de course que personne ne conduit jamais. » Là où l'entraînement requiert des puces informatiques très puissantes hébergées dans des centres de données, l'inférence peut se faire via des puces moins chères (quoique toujours très complexes) et dans l'informatique en périphérie.

Newsletter

Tech & IA

Chaque jour à 13h, l’essentiel de l’actualité tech.

Illustration de la newsletter Tech & IA

Guillaume Renouard

Sur le même sujet

Le récent emprunt de SpaceX est mal passé auprès des investisseurs.

SpaceX : comment la coqueluche des marchés a perdu 900 milliards de dollars de valorisation en moins d'un mois

Introduite en Bourse il y a deux semaines, l'action SpaceX a déjà perdu près de 900 milliards de dollars de valeur depuis son pic. En cause, des dépenses colossales dans l'intelligence artificielle, des pertes qui s'accumulent et des investisseurs qui doutent désormais d'une valorisation jugée excessive.

Tech & IA
Le dévéloppement de GTA VI aurait coûté d'après les analystes entre 1 et 2 milliards de dollars.

GTA VI : un blockbuster sans disque qui enterre trente ans de culture de coffret iconique

Une boite pour le jeu vidéo le plus attendu de l'année, Grand Theft Auto VI, sera potentiellement en vente en novembre, mais elle sera vide de tout disque. En supprimant le circuit physique, Rockstar élimine une part du prix absorbé par les intermédiaires et oriente l'essentiel des revenus vers les plateformes numériques.

Tech & IA
ChatGPT proposera désormais trois versions différentes de son agent conversationnel pour des usages spécifiques.

OpenAI lance ses nouveaux modèles GPT-5.6, sous tutelle de la Maison Blanche

OpenAI a présenté sa nouvelle famille de modèles GPT-5.6, censé être plus puissante et moins chère que la précédente. Son déploiement est soumis à l'approbation du gouvernement américain, tout comme celui du concurent Anhtropic.

Tech & IA
Anthropic a secoué le monde de la cyber avec son nouvel agent dédié à la détection de faille. REUTERS/Dado Ruvic

IA : Washington autorise Anthropic à redéployer Mythos 5 auprès des entreprises américaines stratégiques

Peu après son blocage d'urgence, le modèle d'IA Mythos 5 d'Anthropic pourra de nouveau être utilisé par une poignée de groupes américains Le gouvernement l'avait interdit mi-juin, craignant qu'il ne puisse être détourné à des fins offensives par des acteurs malveillants.

Tech & IA
Mirendil ambitionne d’automatiser la recherche en IA

Remplacer l'ingénieur en IA, le pari vertigineux de Mirendil, nouvelle licorne californienne

Forte d’une levée de fonds de 200 millions de dollars et d'une équipe issue d'Anthropic, Mirendil développe des modèles capables d’automatiser la recherche en IA pour les équipes de recherche des entreprises. Un nouveau signe du succès des « néolabs », cette génération émergente d’entreprises d’IA qui s’attaquent à des problèmes que les éditeurs généralistes ne creusent pas.

Premium
Intelligence Artificielle
Selon IBM, l'architecture "0,7 nm" permettrait d'atteindre près de 100 milliards de transistors sur une puce de la taille d'un ongle.

Course aux puces IA : IBM vise un saut technologique à 0,7 nm

IBM affirme avoir mis au point une nouvelle architecture de semi-conducteurs qui pourrait, à l’horizon de cinq ans, ouvrir la voie à des puces « 0,7 nm » offrant 50 % de puissance en plus.

Tech & IA
L'équipe de la start-up bordelaise Haiku spécialiste de l'IA appliquée aux métiers du droit.

Intelligence artificielle : Haiku se finance pour équiper les avocats et professions juridiques

La start-up bordelaise Haiku, spécialiste de l'intelligence artificielle appliquée au droit, a bouclé un deuxième tour de table de trois millions d’euros. Alors qu’elle revendique 5 000 utilisateurs, elle entend accélérer en France et se déployer en Europe sur le marché ultra-concurrentiel des métiers juridiques.

Premium
Tech & IA
Le logiciel repose uniquement sur des solutions développées en interne d’après le fondateur de YesWeHack.

Le normand YesWeHack déploie des agents IA capables de pirater les systèmes pour les protéger

La société normande, connue pour ses programmes de piratage éthique, déploie des agents capables d’attaquer les systèmes informatiques d’une entreprise comme le ferait un hackeur.

Premium
Tech & IA