Claude Fable 5 : l’IA qui sait pirater… mais qui doit se retenir
latribune.fr
Mythos, le modèle d'intelligence artificielle d'Anthropic, est capable de détecter en quelques heures ce que les meilleurs experts mettent des années à trouver.
La Tribune avec ChatGPT
Anthropic rend accessible Claude Fable 5, son modèle d’IA le plus puissant, dérivé d’un système de « classe Mythos » jugé trop dangereux pour être diffusé. En parallèle, le laboratoire garde Mythos 5 sous contrôle, réservant ses capacités de piratage à un petit cercle de cyberdéfenseurs.
Anthropic vient de franchir un cap en rendant public Claude Fable 5, présenté comme son modèle d’intelligence artificielle le plus performant à ce jour et le premier de « classe Mythos » ouvert au grand public. La société détaille ce lancement dans une page dédiée à Claude Fable 5 et Claude Mythos 5. Dans le même mouvement, Anthropic a officialisé l’existence de Claude Mythos 5, un jumeau plus dangereux réservé à un cercle restreint d’acteurs de la cybersécurité via l’initiative Project Glasswing, en partenariat avec des autorités publiques.
Ce double lancement consacre une stratégie inédite : diffuser une IA capable d’exceller en détection de failles et en ingénierie logicielle, tout en enfermant ses capacités offensives derrière des garde-fous et des accords d’accès très sélectifs.
Pourquoi Anthropic lance maintenant Claude Fable 5
Anthropic présente Claude Fable 5 comme le modèle le plus puissant qu’elle ait jamais proposé en disponibilité générale, avec une fenêtre de contexte très étendue et la capacité de gérer des sorties particulièrement longues, pensées pour des cas d’usage complexes. La documentation officielle met en avant des performances de haut niveau en ingénierie logicielle, en tâches de raisonnement et en vision, avec un avantage croissant lorsque les demandes sont longues et sophistiquées. Pour illustrer ces capacités, Anthropic cite notamment des migrations de bases de code massives ou des projets de refonte logicielle accélérés par le modèle, qui auraient pris des mois avec des équipes humaines seules.
Ce lancement intervient après une séquence délicate au printemps 2026, lorsque la première itération de Mythos avait été jugée trop dangereuse pour être rendue publique, en raison de ses capacités à repérer systématiquement des failles de sécurité critiques dans des logiciels et des infrastructures réels. Le laboratoire avait alors suspendu la sortie de ce modèle en expliquant qu’un tel outil pouvait amplifier le risque d’attaques massives contre des services en ligne et des systèmes industriels. Dans ce contexte, Claude Fable 5 apparaît comme une réponse politique autant que technique : offrir une IA « de même classe » que Mythos pour les usages « légitimes », tout en montrant patte blanche aux régulateurs et aux opérateurs critiques sur la maîtrise des risques.
Ce que change une IA « bridée »
Anthropic explique que Claude Fable 5 repose sur la même base technologique que Claude Mythos 5, mais qu’il est entouré de garde-fous conçus pour refuser certaines requêtes jugées trop risquées, notamment en cybersécurité offensive, en biologie sensible ou en chimie. Ces protections sont censées s’appuyer sur des classificateurs de sécurité qui détectent les demandes problématiques et déclenchent des refus explicites, plutôt que de répondre de manière partielle ou ambiguë. Dans certains cas, la plateforme peut aussi rétrograder automatiquement vers un modèle moins puissant, afin de fournir une réponse compatible avec les politiques de sécurité internes du fournisseur.
Newsletter
Tech & IA
Chaque jour à 13h, l’essentiel de l’actualité tech.
Ces garde-fous ne se limitent pas aux scénarios de piratage. Anthropic insiste aussi sur la protection contre les tentatives de « distillation » malveillante, où des acteurs chercheraient à extraire systématiquement le comportement du modèle pour en reproduire les capacités ailleurs. Cela se traduit par des limitations techniques et contractuelles sur les usages de l’API, afin de réduire le risque que des États ou des groupes peu transparents puissent cloner un modèle de niveau Mythos sans passer par les mêmes contraintes de sécurité. Pour les entreprises clientes, ce compromis signifie qu’elles peuvent tirer parti de la puissance de Fable 5 pour leurs tâches métiers, tout en gardant la garantie qu’il ne se transformera pas, sur un simple prompt, en manuel d’attaque clé en main.
Mythos 5, réservé aux cyberdéfenseurs
Claude Mythos 5 reprend les capacités de base de Fable 5, mais avec moins de verrous dans certains domaines, en particulier pour la cybersécurité. Là où Fable 5 doit refuser des scénarios d’attaque trop détaillés, Mythos 5 vise à permettre aux équipes de défense de simuler des offensives complètes : détection automatisée de vulnérabilités, génération de preuves de concept d’exploitation, exploration de combinaisons d’attaques que des équipes humaines n’auraient pas envisagées. L’objectif officiel est d’aider les défenseurs à se mettre dans la peau d’attaquants potentiels pour corriger plus vite les failles les plus critiques.
Anthropic ne propose pas Mythos 5 au public : l’accès passe par un programme restreint, centré sur les cyberdéfenseurs, les fournisseurs d’infrastructures et certains partenaires institutionnels. L’entreprise insiste sur le fait que ce modèle doit rester entre les mains d’organisations capables de le gouverner, avec des contrôles internes robustes et des obligations de signalement des vulnérabilités découvertes. Cette architecture crée une forme de « club » de la cybersécurité, qui bénéficie d’un outil très en avance sur la pratique courante, tandis que le reste du marché doit composer avec Fable 5, plus prudent, pour renforcer sa posture de défense.
Pour les directions de la sécurité (RSSI), les centres opérationnels (SOC) et les équipes de réponse à incident, des modèles de classe Mythos ouvrent des perspectives de gain de productivité considérables. La capacité à automatiser la recherche de failles, à générer des scripts de test ou à prioriser les vulnérabilités selon leur exploitabilité réelle change l’équation économique de la cyberdéfense. Combinés aux outils existants de scanning et de supervision, ces modèles promettent de raccourcir les délais entre la découverte d’un défaut et sa correction, dans un contexte où les régulateurs renforcent leurs exigences de résilience numérique.
Vers une nouvelle ligne rouge entre innovation IA et risques de piratage
En revanche, les entreprises de taille intermédiaire, les administrations et une large partie du tissu économique qui n’auront accès qu’à Claude Fable 5 risquent de subir une nouvelle forme d’asymétrie. Elles disposeront d’un modèle très puissant pour la détection et l’analyse, mais moins armé pour simuler des attaques complètes et explorer des scénarios extrêmes, alors que certains acteurs disposeront de Mythos 5 pour se projeter plus loin. À l’échelle européenne, cette situation interroge les ambitions de souveraineté numérique : faut-il laisser des acteurs privés non européens décider seuls de qui peut utiliser les IA les plus offensives, et selon quelles conditions ? La question du partage d’information sur les vulnérabilités trouvées par ces modèles deviendra centrale pour éviter que les gains de sécurité se concentrent chez quelques grands groupes.
La stratégie d’Anthropic s’inscrit dans un paysage réglementaire en mutation, marqué par l’AI Act en Europe et par une série d’initiatives américaines pour encadrer les systèmes d’IA dits « à haut risque ». En séparant un modèle grand public bridé d’un modèle réservé à un cercle restreint, l’entreprise met en pratique une forme de régulation privée : segmentation des capacités selon les profils d’accès, blocage de domaines jugés trop dangereux, contractualisation avec des partenaires jugés de confiance.