IA : Nvidia parie sur l'inférence pour maintenir sa domination mondiale

Publié le 17 mars 2026 à 08:38

Ce contenu est réservé aux abonnés La Tribune

Le PDG de NVIDIA, Jensen Huang, prend la parole à côté du système NVIDIA Vera Rubin lors de la conférence mondiale sur l’IA NVIDIA GTC à San Jose, en Californie, le 16 mars 2026.

REUTERS - FRED GREAVES 2025 - Fred Greaves

Ajouter La Tribune à vos sources préférées

Lors de la GPU Technology Conference, lundi soir, le patron du géant des puces, Jensen Huang, a annoncé que ses ventes seront bientôt portées par l’utilisation en temps réel des intelligences artificielles et non par l’entraînement des modèles de langages.

Les informations à retenir

Pourquoi l'inférence est-elle vitale pour Nvidia en 2026 ?

L'inférence (usage des IA) représentait déjà 40% des revenus data centers de Nvidia en 2025.
Le déploiement massif des agents IA en entreprise génère un besoin critique en puissance.
Nvidia cherche à rassurer les marchés en diversifiant ses sources de revenus au-delà de l'entraînement.

C’est un changement majeur dans le monde de l’intelligence artificielle. Lors de la conférence d’introduction de la GPU Technology Conference (GTC) 2026, lundi 16 mars, le patron de Nvidia, Jensen Huang, a affirmé que « le point d’inflexion de l’inférence est arrivé. »

Dans le monde des IA génératives, deux activités sont fortement demandeuses de puissance de calcul et de semi-conducteurs : l’entraînement des modèles de langage et l’utilisation en temps réel par les clients, appelée « inférence ».

L’inférence, relais de croissance des vendeurs de puces

Si, jusqu’ici, c’est la première activité qui avait fait s’envoler les revenus du géant, lors de sa grande messe annuelle, son iconique patron a souligné que l’inférence serait le futur relais de croissance.

« La dépendance de Nvidia aux puces d’entraînement commence à inquiéter, donc Jensen Huang parle du marché de l’inférence pour rassurer en laissant entendre que son entreprise va se diversifier », analyse Lionel Melka, gérant de portefeuille chez Swann Capital.

A LIRE AUSSI

IA : Nvidia diviserait par trois son investissement dans OpenAI

Il faut dire que l’inférence pourrait rapporter gros. Alors que l’envolée des ventes de Nvidia a été portée par l’entraînement des modèles de langage ces dernières années, l’entreprise estime qu’en 2025, l’inférence a généré environ 40 % de son chiffre d’affaires issu des centres de données.

Maxime Heuze

IA : Nvidia parie sur l'inférence pour maintenir sa domination mondiale

Les informations à retenir

Pourquoi l'inférence est-elle vitale pour Nvidia en 2026 ?

L’inférence, relais de croissance des vendeurs de puces

Sur le même sujet

Les informations à retenir

Pourquoi l'inférence est-elle vitale pour Nvidia en 2026 ?

L’inférence, relais de croissance des vendeurs de puces

Sur le même sujet