Intelligence artificielle : une expérience montre que l’IA peut aussi faire perdre du temps aux développeurs

Bogdan Bodnar

Photo d'illustration
La Tribune avec Dall-E

Bogdan Bodnar

Photo d'illustration
La Tribune avec Dall-E
Depuis trois ans, les outils d'intelligence artificielle générative s'invitent dans le quotidien des ingénieurs logiciels du monde entier. GitHub Copilot, Cursor Pro, Replit, Amazon CodeWhisperer ou encore Tabnine, les programmes capables d'écrire des fonctions entières à partir de simples requêtes, de corriger des bugs, ou encore d'automatiser des tests unitaires se sont multipliés avec la promesse d'un gain de productivité immédiat.
Une étude rigoureuse publiée le 11 juillet 2025 par le laboratoire de recherche indépendant METR (Model Evaluation and Transparency Research) vient tempérer cet enthousiasme. Loin d'accélérer le travail des développeurs aguerris, l'usage de ces outils pourrait, dans certains cas, ralentir leur exécution.
Pour tester les apports de l'IA dans le codage professionnel, les chercheurs de METR ont mené un essai, impliquant 16 développeurs expérimentés. Chacun s'est vu attribuer un ensemble de 246 tâches concrètes à réaliser sur de vastes dépôts de code open source (en source ouverte) auxquels ils contribuent régulièrement.
Les tâches ont été réparties en deux groupes : dans le premier, les participants étaient autorisés à recourir aux outils d'IA de leur choix. Dans le second, tout recours à l'intelligence artificielle était interdit. Avant de se lancer, les développeurs ont dû estimer l'impact attendu de ces outils sur leur efficacité : ils tablaient sur un gain de 24 % de temps.
La réalité fut tout autre. L'analyse des résultats a révélé un allongement moyen de 19 % du temps de complétion des tâches pour les développeurs ayant utilisé l'IA. Autrement dit, les participants ont été plus lents avec les outils d'assistance que sans.
Chaque jour à 13h, l’essentiel de l’actualité tech.

Le test menée par METR vient nuancer l'idée d'une efficacité universelle des assistants de codage. Selon les chercheurs, ce ralentissement ne tient pas tant à la qualité du code généré qu'à la charge supplémentaire induite par ces outils. « Les développeurs passent davantage de temps à rédiger des requêtes pour l'IA, à attendre ses suggestions, puis à les relire, les tester, ou les rejeter. Ce cycle perturbe le flux de concentration classique du développement logiciel », soulignent les auteurs du rapport.
Les modèles actuels rencontrent également des limites importantes dans les bases de code complexes, précisément celles sur lesquelles les participants de l'étude ont travaillé. En l'absence de contexte suffisant ou face à des architectures logicielles peu documentées, l'IA peine à produire des réponses cohérentes ou adaptées à la logique du projet.
Autre facteur à considérer : seulement 56 % des participants avaient déjà utilisé Cursor, l'outil IA principal de l'étude. Et bien que 94 % aient une expérience préalable avec des modèles de langage en ligne (comme ChatGPT ou Claude), plusieurs découvraient Cursor à cette occasion. Une formation préalable avait bien été assurée, mais sans doute insuffisante pour intégrer pleinement l'outil à un rythme professionnel.
Les auteurs de l'étude prennent soin de nuancer leurs conclusions. Ils ne contestent pas les bénéfices réels que les assistants IA peuvent offrir à de nombreux développeurs, en particulier les débutants ou dans des environnements bien structurés. D'autres études, à plus grande échelle, ont d'ailleurs mis en évidence des gains de productivité dans certains contextes industriels. « Nous ne disons pas que l'IA ralentit tous les développeurs, ni que ces outils sont inefficaces dans l'absolu. Mais notre étude montre que, dans des conditions professionnelles exigeantes, l'effet peut être contre-productif à court terme », expliquent les chercheurs de METR.
À lire également
L'organisme rappelle également que les progrès des modèles sont exponentiels : des conclusions similaires, tirées aujourd'hui, pourraient être obsolètes dans quelques mois seulement. METR a d'ailleurs observé une amélioration significative des performances des outils IA dans la résolution de tâches complexes à long terme.
Bogdan Bodnar