Le gouvernement américain a annoncé mardi des accords avec Google DeepMind, Microsoft et xAI qui vont lui donner accès à leurs nouveaux modèles d'intelligence artificielle (IA) pour évaluer leurs capacités avant leur sortie.
En accordant au gouvernement Trump un accès anticipé à leurs modèles d’IA, Google DeepMind, Microsoft et xAI acceptent que leurs systèmes les plus avancés soient examinés par l’administration américaine avant même leur sortie.
La Maison-Blanche a officialisé ce mardi 5 mai des accords avec Google DeepMind, Microsoft et xAI qui offrent au gouvernement Trump un accès anticipé à leurs nouveaux modèles d’intelligence artificielle, avant même leur mise sur le marché, pour en évaluer les capacités et les risques. Ce dispositif, piloté par le Centre pour les standards et l’innovation dans l’IA (Caisi), consacre le fait que l’évaluation technique de l’IA la plus avancée devient un instrument central de sécurité nationale et de politique industrielle.
Au début de son mandat, Donald Trump avait pourtant envoyé un signal inverse en annulant le décret de Joe Biden qui imposait aux entreprises de l’IA de transmettre au gouvernement fédéral certaines données sur leurs modèles les plus puissants. Un an plus tard, le président républicain prend acte de l’accélération technologique et du contexte géopolitique : l’IA générative et les agents logiciels capables d’agir de manière semi-autonome ne sont plus seulement un sujet de concurrence économique, mais un enjeu stratégique de cybersécurité, de renseignement et de défense.
En donnant à l’exécutif un droit de regard en amont sur les systèmes de Google DeepMind, Microsoft et xAI, les accords présentés à Washington visent autant à anticiper les usages malveillants qu’à éviter un « moment Mythos », du nom de ce modèle d’Anthropic dont la commercialisation a été reportée en raison de sa capacité à découvrir des vulnérabilités logicielles à grande échelle.
Selon une enquête d’Axios, l’Agence nationale de sécurité (NSA) a, elle, obtenu un accès réservé au modèle Mythos pour conduire ses propres tests, illustrant le risque de voir les modèles jugés trop dangereux pour le grand public captés par les agences de sécurité.
Pour la Maison-Blanche, l’objectif affiché est désormais de ne plus se laisser surprendre par les capacités réelles des futurs modèles d’IA les plus puissants, qu’il s’agisse de systèmes civils pour le cloud ou de briques susceptibles d’alimenter des applications militaires, offensives ou de cyberespionnage.
Newsletter
Tech & IA
Chaque jour à 13h, l’essentiel de l’actualité tech.
Le Caisi, bras technique du contrôle des modèles
Émanation du gouvernement fédéral hébergée au sein du département du Commerce, le Caisi a été construit sur la base du Centre pour la sûreté de l'IA créé sous l’administration Biden, avant d’être renommé et repositionné autour de la normalisation et de l’évaluation des modèles les plus avancés. Sa mission officielle : conduire des évaluations ciblées sur des systèmes considérés comme stratégiques, produire des recommandations techniques sur leurs risques et contribuer à l’élaboration de standards pour l’industrie.
Dans la pratique, le Caisi s’appuie étroitement sur l’écosystème du National Institute of Standards and Technology (Nist), qui développe depuis plusieurs années un corpus de cadres méthodologiques et d’outils pour évaluer l’IA, de la gestion des risques au test « adversarial ».
Comparaison des performances respectives ces agents américains et chinois par le Caisi. (Crédits : Caisi/Nist)
Il pilote aussi des campagnes de tests à grande échelle, notamment sur les agents d’IA, ces programmes capables d’appeler du code, d’interagir avec des systèmes critiques ou de lancer des actions dans le monde réel. Un billet de blog du Centre, intitulé « Insights into AI Agent Security from a Large-Scale Red-Teaming Competition », détaille ainsi une compétition internationale de tests qui a mis en évidence des schémas récurrents de contournement des garde-fous et de coordination entre agents, autant de signaux que Washington veut désormais détecter en amont de tout déploiement massif.
Quasi-sésame d’accès au marché
Officiellement, les cadres élaborés par le Nist, comme son cadre de gestion des risques de l’IA (AI Risk Management Framework), restent sur la base du simple volontariat et ne créent pas d’obligations juridiques directes pour les entreprises. Mais à mesure que les agences fédérales alignent leurs appels d’offres et leurs procédures de conformité sur ces outils, ces normes se transforment, de fait, en condition d’accès aux marchés publics, aux financements et à la bienveillance réglementaire.
Avec le Caisi, cette dynamique franchit une étape : les méthodes d’évaluation conçues au départ pour aider les organisations à mieux mesurer les risques deviennent le socle d’un filtre centralisé sur les modèles jugés les plus sensibles. L’accès anticipé aux systèmes de Google DeepMind, Microsoft et xAI permet à Washington de confronter leurs performances et leurs vulnérabilités à une grille d’analyse que le pouvoir exécutif contrôle largement, depuis la définition des métriques jusqu’aux seuils de risque jugés acceptables.
Ce glissement est renforcé par les premières évaluations de modèles étrangers, comme celles que le Caisi a menées sur le chinois DeepSeek V4 Pro, en soulignant à la fois des risques de sécurité et un retard technologique estimé à plusieurs mois sur les meilleurs modèles américains. Même lorsqu’elles n’ont pas de force réglementaire immédiate, ces évaluations deviennent des références pour les décideurs publics, les investisseurs et les grands clients privés, contribuant à structurer les perceptions de la «sûreté» et de la «maturité» des différents acteurs.
Ce que les géants du numérique gagnent (et risquent) en ouvrant leurs modèles
Pour Google DeepMind, Microsoft et xAI, accepter de livrer leurs modèles d’IA les plus avancés au Caisi avant toute annonce publique revient à prendre un pari sur la durée : celui d’acheter à la Maison-Blanche une forme de prévisibilité réglementaire en échange d’une transparence accrue sur leurs capacités les plus sensibles. Les groupes y gagnent un accès privilégié aux marchés publics et de défense, un siège à la table où se définissent les métriques de référence de l’IA et la possibilité de modeler les standards qui s’imposeront ensuite à leurs concurrents.
Ces acteurs, déjà engagés dans des contrats massifs avec le Pentagone ou les agences de renseignement, s'apprêtent donc à s'aligner avec les priorités du Caisi et du Nist pour accéder à des usages classifiés, où les modèles sont adaptés à des besoins spécifiques et rémunérés à des niveaux sans comparaison avec les offres grand public. À l’inverse, un avis défavorable sur un système trop permissif en matière de cyberattaques ou de prolifération d’armes biologiques peut retarder son lancement, imposer des coûts supplémentaires de renforcement des garde-fous ou pousser à créer des versions différenciées pour le marché civil et les clients gouvernementaux.
Les risques ne sont pas uniquement financiers. En exposant leurs modèles non publiés à des évaluateurs fédéraux, les entreprises renforcent une asymétrie d’information au profit de l’État, qui peut détecter des capacités émergentes, des combinaisons de fonctionnalités ou des voies de contournement que les équipes internes n’ont pas encore identifiées. Couplée à la possibilité d’accords confidentiels comme celui évoqué autour du modèle Mythos d’Anthropic et de la NSA, cette asymétrie nourrit le spectre d’un nouveau complexe militaro-industriel de l’IA dans lequel les innovations les plus sensibles basculent, en partie, hors du champ concurrentiel classique.
L’évaluation devient arme géopolitique
L’évaluation par le Caisi des modèles de DeepSeek, vitrine de l’IA chinoise, illustre déjà la dimension géopolitique de ce nouveau dispositif : en objectivant, avec ses propres métriques, l’écart de performance, de coût et de sûreté entre systèmes américains et chinois, Washington se dote d’un instrument de narration stratégique auprès de ses alliés comme de ses industriels. Ces rapports alimentent les débats sur les contrôles à l’exportation, la sécurisation des chaînes de valeur et la justification de dépenses massives dans l’IA de défense.
À l’autre bout du spectre, l’affaire Mythos montre comment un modèle conçu par un acteur privé peut être jugé trop dangereux pour une diffusion large, tout en devenant suffisamment précieux pour que la NSA obtienne un accès dédié, en dehors de tout cadre public de gouvernance. Là encore, les outils d’évaluation ne se limitent pas à un rôle de certification, mais servent aussi à repérer les systèmes dont l’État souhaite s’assurer le contrôle.
Pour les Européens, cette montée en puissance d’un contrôle en amont des modèles pose une double question : celle de la souveraineté technologique, face à un allié capable de dicter de facto les standards de sûreté, et celle de l’accès aux capacités les plus avancées, si une partie d’entre elles reste confinée dans un périmètre de sécurité nationale. À l’heure où l’Union européenne mise sur une régulation plus juridique avec le règlement sur l’IA, la stratégie qui articule Maison-Blanche dessine un autre chemin : celui d’une gouvernance par les tests, les métriques et les accords bilatéraux, qui pourrait s’imposer comme la nouvelle langue de pouvoir de l’IA.