IA : Apple tacle la supposée intelligence des chatbot ChatGPT et Claude
Bogdan Bodnar
Ce contenu est réservé aux abonnés La Tribune

Photo d'illustration
Reuters
Bogdan Bodnar
Ce contenu est réservé aux abonnés La Tribune

Photo d'illustration
Reuters
La date de publication est bien calculée. 72 heures avant la WWDC, la conférence annuelle d'Apple organisée le 9 juin, la marque à la pomme a publié un rapport qui fait déjà débat au sein la sphère intelligence artificielle. Baptisée The Illusion of Thinking, en français L'Illusion de penser, cette étude menée par les meilleurs cerveaux de la recherche du groupe de Cupertino expose de manière critique les limites des populaires modèles de langage. À travers plusieurs tests bien connus dans le milieu de la neuropsychologie, l'équipe d'experts a soumis DeepSeek, Claude, LLaMA ou encore la version o3 de ChatGPT à ces expériences. Les modèles plus récents d'OpenAI ou de Google Gemini n'ont pas été éprouvés, les deux groupes ne divulguant pas suffisamment d'informations sur la manière dont leurs programmes raisonnent pour permettre aux chercheurs d'analyser le cheminement vers la réponse.
À travers quatre exercices, les chatbots ont eu droit à plus de 3 000 tentatives chacun pour résoudre les puzzles. Résultat ? Que ce soit Claude, DeepSeek ou o3-mini, tous les modèles s'effondrent — qu'ils soient conçus pour « penser » (LRM) ou simplement pour générer du texte (LLM).
À lire également
Pour illustrer les limites du raisonnement des intelligences artificielles, Apple s'est penché sur un casse-tête connu des mathématiciens : la tour de Hanoï. Ce jeu de logique consiste à déplacer une pile de disques de tailles différentes d'une tige à une autre, en respectant deux règles : ne bouger qu'un disque à la fois, et ne jamais poser un disque plus grand sur un plus petit.

Bogdan Bodnar