Imaginez un assistant intelligent capable de rédiger des e-mails ou de résumer un rapport PDF, même en avion ou sans connexion à internet. Ou encore un outil intégré dans un logiciel médical, capable de répondre à des questions complexes en langage naturel, sans que les données du patient quittent l’établissement de santé.
OpenAI rouvre ses modèles
Tout cela est possible grâce à des modèles que l’on peut télécharger et exécuter directement sur son ordinateur. Plusieurs entreprises d’IA proposent déjà ce type de modèles dits en « poids ouverts » (open-weight) : autrement dit, les paramètres appris pendant l’entraînement sont accessibles et réutilisables librement.
C’est le cas de Meta (avec Llama), de la start-up française Mistral (qui va plus loin en publiant également son code source en open source), ou encore de DeepSeek, dont les modèles performants ont secoué le petit monde de l’IA en début d’année… y compris chez OpenAI.
Le créateur de ChatGPT publiait lui aussi des modèles open source jusqu’à GPT-2, en 2019. Mais depuis, l’entreprise de Sam Altman s’était recentrée sur des modèles propriétaires. Du moins, jusqu’à aujourd’hui : OpenAI propose désormais deux modèles en poids ouverts, gpt-oss-120b (120 milliards de paramètres) et gpt-oss-20b (20 milliards).
Le plus grand modèle nécessite un GPU doté de 80 Go de mémoire vive, le plus petit tourne lui avec 16 Go. Ce qui le rend accessible aux ordinateurs récents, comme les Mac avec puces Apple ou des PC de gamers. Bien sûr, cela reste des machines assez costaudes et pas réellement grand public (la vaste majorité des PC portables est exclue). Mais il n’empêche : gpt-oss-20b reste relativement accessible à ceux disposant d’une machine un peu musclée.
En termes de performances, OpenAI annonce que ses nouveaux modèles sont proches, voire supérieurs, aux modèles propriétaires o3-mini et o4-mini. Ils utilisent des techniques de raisonnement, c’est à dire qu’ils « réfléchissent » en détaillant leur processus de pensée, plutôt que de donner uniquement une réponse.
Sur la question de la sécurité, OpenAI a soumis ces modèles à des tests rigoureux, y compris des simulations de fine-tuning malveillant. Résultat : pas de risques critiques identifiés. Enfin, gpt-oss est publié sous licence Apache 2.0 : les utilisateurs peuvent non seulement adapter les modèles à leurs besoins, mais aussi partager librement leurs projets, y compris les projets commerciaux.
Ces modèles sont disponibles gratuitement sur la plateforme Hugging Face et peuvent être personnalisés, affinés, ou intégrés dans des applications existantes.
🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.