IA : Avec Project Genie, Google accélère la course aux « world models »
Ce contenu est réservé aux abonnés La Tribune

Project Genie
Ce contenu est réservé aux abonnés La Tribune

Project Genie
Un paquet de cigarette explorant une station de métro, la crucifixion de Jésus façon jeu vidéo, et moult faux extraits de Zelda ou GTA… Comme souvent lorsqu’un nouveau « joujou » IA sort, les utilisateurs inondent les réseaux sociaux de leurs premières expérimentations. Et Project Genie, le dernier né de Google, n’y coupe pas. Cet outil, pour le moment uniquement accessible aux abonnés Ultra américains, combine trois modèles de Google : Gemini, son grand modèle de langage (LLM), Nano Banana, son générateur d’images, et surtout Genie 3, son « world model » présenté en août 2025.
À lire également
Les « world models » (ou modèle du monde) désignent des IA capables de simuler le monde physique qui nous entoure, de prédire les conséquences des actions et d’utiliser cette connaissance pour prendre des décisions autonomes. Ils sont depuis un an environ un champ de recherche important chez les acteurs de l’IA. Car certains - Yann LeCun notamment - estiment que la compréhension du monde physique est indispensable pour parvenir à une IA mimant le mieux possible l’intelligence humaine, graal de l’industrie. Chose que les grands modèles de langage seuls ne peuvent pas acquérir.
Project Genie ne se contente donc pas de générer des vidéos, mais des mondes explorables et « jouables » - de façon encore très limitée.