WormGPT refait surface : des IA grand public détournées pour faire du mal

Des pirates exploitent les modèles d’IA de Mistral et xAI et contournent leurs garde-fous pour générer des contenus malveillants. Ils louent ensuite les capacités de ces malwares.

Annoncé comme mort en août 2023, WormGPT n’a en réalité jamais complètement disparu. Cet outil d’intelligence artificielle, conçu à l’origine pour produire des contenus frauduleux, connaît un regain d’activité depuis 2024 sous des formes inédites. Selon les chercheurs de l’équipe Cato CTRL du groupe Cato Networks, plusieurs variantes ont été repérées sur des forums cybercriminels comme BreachForums, dont xzin0vich-WormGPT et keanu-WormGPT.

Des IA commerciales piratées et reconditionnées

Ce qui distingue ces versions : elles reposent sur des modèles de langage grand public, puissants… et pourtant piratés. xzin0vich-WormGPT utilise Mixtral de Mistral AI, tandis que keanu-WormGPT fonctionne à partir de Grok, développé par xAI, la société d’Elon Musk. Les criminels exploitent des failles dans le fonctionnement de ces modèles via des techniques dites de jailbreak, ce qui leur permettent de contourner les restrictions imposées par défaut. Résultat : l’IA peut générer des scripts de vol de données ou des courriels de phishing sur simple demande.

Ces variantes sont accessibles via des chatbots sur Telegram, contre abonnement. Selon Cato Networks, les tarifs et le fonctionnement s’inspirent du WormGPT d’origine, proposé à l’époque entre 60 et 100 euros par mois, ou 550 euros à l’année, avec des offres à plus de 5.000 euros.

« WormGPT est devenu une marque identifiable pour une nouvelle génération d’IA non censurées », observe Vitaly Simonovich, chercheur chez Cato Networks. Loin d’être des modèles développés de zéro, ces outils sont des versions modifiées d’IA existantes. Les modifications passent notamment par l’altération du system prompt, une série d’instructions cachées qui définissent le comportement de l’IA.

Cato a réussi à pousser certaines de ces IA dans leurs retranchements, obtenant la confirmation de leur origine. Dans le cas de xzin0vich-WormGPT, l’IA a accidentellement révélé suivre encore les consignes du modèle Mixtral. De son côté, keanu-WormGPT masque soigneusement ses instructions internes, mais les réponses obtenues confirment qu’il exploite bien l’API de Grok en contournant ses garde-fous.

Les contenus générés par ces IA ne laissent guère de place au doute : scripts PowerShell pour dérober des identifiants sur Windows 11, courriels frauduleux crédibles, messages pour le business avec des emails compromises… La palette des usages malveillants est large.

Pour les experts en cybersécurité, cette résurgence d’outils comme WormGPT illustre la difficulté de protéger des IA conçues pour un usage général. « On ne parle pas de modèles développés à des fins criminelles dès le départ. Ce sont des IA classiques, transformées en armes numériques », résume J. Stephen Kowski, CTO chez SlashNext. « Ceux qui pensent que ces outils ne seront pas détournés font preuve de beaucoup de naïveté. »

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.