Lors de la GPU Technology Conference, lundi soir, le patron du géant des puces, Jensen Huang, a annoncé que ses ventes seront bientôt portées par l’utilisation en temps réel des intelligences artificielles et non par l’entraînement des modèles de langages.Les informations à retenir
Pourquoi l'inférence est-elle vitale pour Nvidia en 2026 ?
L'inférence (usage des IA) représentait déjà 40% des revenus data centers de Nvidia en 2025.
Le déploiement massif des agents IA en entreprise génère un besoin critique en puissance.
Nvidia cherche à rassurer les marchés en diversifiant ses sources de revenus au-delà de l'entraînement.
C’est un changement majeur dans le monde de l’intelligence artificielle. Lors de la conférence d’introduction de la GPU Technology Conference (GTC) 2026, lundi 16 mars, le patron de Nvidia, Jensen Huang, a affirmé que « le point d’inflexion de l’inférence est arrivé. »
Dans le monde des IA génératives, deux activités sont fortement demandeuses de puissance de calcul et de semi-conducteurs : l’entraînement des modèles de langage et l’utilisation en temps réel par les clients, appelée « inférence ».
L’inférence, relais de croissance des vendeurs de puces
Si, jusqu’ici, c’est la première activité qui avait fait s’envoler les revenus du géant, lors de sa grande messe annuelle, son iconique patron a souligné que l’inférence serait le futur relais de croissance.
« La dépendance de Nvidia aux puces d’entraînement commence à inquiéter, donc Jensen Huang parle du marché de l’inférence pour rassurer en laissant entendre que son entreprise va se diversifier », analyse Lionel Melka, gérant de portefeuille chez Swann Capital.
Il faut dire que l’inférence pourrait rapporter gros. Alors que l’envolée des ventes de Nvidia a été portée par l’entraînement des modèles de langage ces dernières années, l’entreprise estime qu’en 2025, l’inférence a généré environ 40 % de son chiffre d’affaires issu des centres de données.