Passer au contenu

Anthropic lance la version sécurisée de Claude Mythos : “Fable 5” s’autocensure sur des questions liées aux cyberattaques, à la biologie ou à la chimie

Anthropic vient de lancer Claude Fable 5, un modèle d’IA qui est aussi puissant que Mythos, mais qui a été bridé dans certains domaines pour écarter les risques.

Le grand public a enfin la possibilité de tester la puissance de Claude Mythos, la nouvelle IA d’Anthropic. Hier soir, le laboratoire d’intelligence artificielle a lancé Claude Fable 5. Celui-ci a le même niveau que Claude Mythos 5, mais il a été sécurisé de manière à écarter les risques en cybersécurité. En ce qui concerne les performances, Claude Fable 5 est désormais la plus puissante IA sur le marché, selon le classement d’Artificial Analysis.

De son côté, Anthropic indique que Fable 5 dépasse tous les autres modèles d’IA accessibles au grand public sur toutes les évaluations qui ont été utilisées pour tester ses performances (codage, tâches administratives, recherche scientifique, etc.). L’entreprise met en avant les compétences de sa nouvelle IA dans le développement de logiciels et indique que durant les tests chez Stripe, Fable 5 a pu accomplir en quelques jours un travail d’ingénieur qui prend normalement plusieurs mois. Claude Fable 5 est aussi très bon dans la finance et dans l’analyse d’images. Et il a le score le plus élevé sur l’évaluation GDPval-AA, qui mesure les performances pour les tâches administratives.

Anthropic propose Claude Fable 5 aux utilisateurs de la version payante de Claude, jusqu’au 22 juin. Ensuite, l’IA sera accessible via un système d’achat de crédit d’utilisation. Mais, plus tard, lorsqu’Anthropic aura assez de puissance de calcul, il intègrera définitivement Fable 5 à ses offres d’abonnement.

L’IA s’autocensure pour des raisons de sécurité

En tout cas, Fable 5 est désormais le nouveau modèle de référence pour automatiser les tâches les plus complexes. Néanmoins, l’IA refusera de répondre et vous redirigera automatiquement vers Claude Opus 4.8, un modèle moins puissant, pour la plupart des questions liées à la biologie ou à la chimie. En effet, les compétences avancées du modèle dans ces domaines font que celui-ci pourrait être dangereux.

Pareillement, Anthropic a aussi développé un mécanisme qui empêche Fable 5 d’être utilisé pour lancer des cyberattaques, car les modèles d’IA de la catégorie “Mythos” affichent des performances inquiétantes en matière de “piratage agentique”.

Quant à Claude Mythos 5, la version non bridée, elle est accessible aux organisations autorisées par Anthropic, pour les actions défensives (trouver et réparer des failles de sécurité). Et comme le modèle est aussi très bon en biologie, Anthropic indique qu’il compte également proposer cette version non bridée à des organisations qui travaillent dans le domaine biomédical.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.

Mode