Derrière le marketing spectaculaire d'Anthropic, le très médiatisé modèle Mythos souffre en coulisses des tares classiques de l'IA générative, multipliant les hallucinations et contresens. La Tribune a rencontré en exclusivité à San Francisco les experts de la cybersécurité qui ont soumis le programme à l'épreuve du feu.
La planète cyber retient son souffle. L'accès à Claude Mythos, l’intelligence artificielle d’Anthropic capable, d’après ses concepteurs, de débusquer une faille dans n’importe quel système, pourrait être libéré par le gouvernement américain. Le nouveau champion de l’IA a annoncé ce 1ᵉʳ juillet que ses derniers modèles, dont le très attendu Fable, pourront de nouveau être exploités, bien que l'usage de Mythos resterait pour l’instant encadré par de strictes conditions.
Car l’exploitation de ce programme, présentée comme une arme de cyberattaque massive, provoque une vive anxiété. Le 11 juin dernier, le sénateur Mark Warner a publiquement relayé un test de la NSA indiquant que « Mythos a réussi à pénétrer presque tous nos systèmes classifiés, non pas en plusieurs semaines, mais en seulement quelques heures. »
De quoi nourrir le mythe entourant le modèle, et asseoir la valeur potentielle d’Anthropic, qui prépare son entrée en Bourse. En fin de compte, au-delà de ces déclarations spectaculaires des dirigeants et de Washington, comment accorder un crédit absolu au modèle alors qu'Anthropic n’a ouvert son accès qu’à une centaine d’entreprises triées sur le volet, liées par de stricts accords de confidentialité ?
Nous avons rencontré à San Francisco ces experts qui ont soumis Mythos à l’épreuve du feu. On découvre alors que le programme présente encore toutes les failles intrinsèques à l'intelligence artificielle : l’hallucination, l’injonction de répondre à tout prix ou encore l’erreur de contexte.
Un programme réservé à quelques entreprises élues
Si cette technologie s'impose indéniablement comme un outil en passe de bouleverser l’univers de la tech, les testeurs rappellent l'existence de limites concrètes à considérer avant de s'y précipiter aveuglément.
Newsletter
Tech & IA
Chaque jour à 13h, l’essentiel de l’actualité tech.
Entre les collines roussies par le soleil, les bureaux blancs immaculés de Palo Alto Networks, caractéristiques des grands groupes de la Silicon Valley, abritent des tests de piratage qu’envierait n’importe quelle puissance étatique. Le groupe, l'un des leaders mondiaux de la cybersécurité, figure parmi les premiers partenaires du projet Glasswing, ce cercle restreint d’entreprises autorisées par Anthropic à tester Mythos. Pour l'heure, Palo Alto Networks se cantonne à employer l'outil sur un nombre restreint de logiciels.