OpenAI et Google DeepMind viennent de remporter des médailles d’or aux prestigieuses Olympiades internationales de mathématiques. Une prouesse technique indéniable, mais qui soulève de nombreuses réserves chez les chercheurs.Presque trente ans après le célèbre duel entre Garry Kasparov et l'ordinateur Deep Blue d'IBM, l'intelligence artificielle continue d'affronter l'intelligence humaine, cette fois sur le terrain des mathématiques. Fin juillet, OpenAI, puis Google DeepMind, ont chacun revendiqué une médaille d'or aux Olympiades internationales de mathématiques (IMO), une compétition prestigieuse, souvent considérée comme l'Everest du raisonnement mathématique pour les jeunes étudiants.
L'exploit tient au fait que ces performances ont été réalisées par des modèles de langage généralistes, certes optimisés pour les mathématiques, mais loin des programmes spécifiquement conçus pour ce domaine, comme c'était le cas autrefois. À noter que les IMO ne sont pas une « simple » course contre-la-montre, mais un concours de raisonnement : les candidats doivent résoudre six problèmes complexes, notés selon des critères de rigueur et de créativité. Sur les 630 participants, seuls les 10 % les mieux notés obtiennent une médaille d'or.
Google et OpenAI ont chacun atteint ce niveau d'excellence, mais se disputent la victoire sur les modalités d'évaluation : DeepMind a soumis ses réponses aux correcteurs officiels, tandis qu'OpenAI s'est appuyée sur les notations de trois anciens médaillés de l'IMO. Cela n'a pas empêché Sam Altman, PDG d'OpenAI, de se réjouir sur le réseau X : « Quand nous avons lancé OpenAI, ce genre de résultat relevait du rêve lointain », a-t-il déclaré.
L'apport de l'IA à la recherche mathématique remis en question
Mais dans le monde académique, certains appellent à tempérer cet enthousiasme. Terence Tao, l'un des mathématiciens les plus respectés de la planète, estime que résoudre des problèmes « comparables à ceux de l'IMO » ne suffit pas à démontrer qu'un modèle peut rivaliser avec les humains dans un concours normalisé, aux conditions neutres. Il alerte sur le risque de biais, liés à des conditions d'examen trop favorables pour l'apprentissage et le raisonnement d'un modèle programmé.