OpenAI évalue la dangerosité de son dernier modèle d'IA comme « moyenne »
François Manens
Ce contenu est réservé aux abonnés La Tribune

La prochaine génération de modèles d'IA sera-t-elle plus dangereuse ?
DADO RUVIC
François Manens
Ce contenu est réservé aux abonnés La Tribune

La prochaine génération de modèles d'IA sera-t-elle plus dangereuse ?
DADO RUVIC
Quand faudra-t-il vraiment s'inquiéter des dangers de l'intelligence artificielle ? C'est la question que se pose toute l'industrie. Et d'après les entreprises qui créent ces IA, la réponse reste « pas maintenant ». Comme l'a repéré The Verge, OpenAI a publié jeudi un document de recherche sur les mesures de sécurité et l'évaluation des risques qu'il a mises en place avant de publier son dernier modèle d'IA, GPT-4o. Bilan : il ne comporterait qu'un risque « moyen ». En mars, son concurrent Anthropic tirait la même conclusion lors de la sortie de son IA Claude 3.
Chez OpenAI, l'évaluation des risques de l'IA se découpe en quatre catégories : sa capacité à devenir une menace de cybersécurité, la capacité du modèle à aider au développement d'une menace biologique, ses capacités de persuasion, et la possibilité qu'il agisse en autonomie, sans contrôle humain, comme Skynet dans le film Terminator. Cette grille se concentre uniquement sur des risques existentiels et financiers, et ignore tout un éventail d'autres risques, comme les potentiels effets de la technologies sur les inégalités.
À lire également
Dans le détail, OpenAI a mesuré que son modèle GPT-4o comporte des risques faibles, à l'exception du risque de persuasion, un peu plus élevé. Les chercheurs concèdent que l'IA est capable d'écrire des textes destinés à influencer l'opinion plus performants que ceux écrits par des humains. Mais ils précisent que ce constat se limite à des cas précis.
François Manens