Ce jeudi 19 février, Google a déployé la version preview du nouveau modèle de langage (LLM) de son IA phare, Gemini Pro 3.1. Successeur de Gemini 3 sorti en novembre dernier, cette nouvelle version apporte des performances accrues et un raisonnement plus poussé encore.
La version définitive de Gemini Pro 3.1 ne sortira que dans quelques semaines, certes, mais l’on peut déjà avoir un vrai aperçu de ce dont il est capable. Les premiers benchmarks sont tombés, et donnent le nouveau modèle vainqueur haut la main.
Gemini Pro 3.1 affiche des résultats en forte hausse par rapport à la concurrence, et même par rapport aux précédentes versions de l’IA de Google. Deux benchmarks indépendants ont par ailleurs donné d’excellents résultats au nouveau modèle, parmi lesquels Humanity’s Last Exam et APEX-Agents. Le premier évalue la puissance intellectuelle du modèle, sa capacité à raisonner, tandis que le second analyse l’efficacité concrète en contexte de travail, la manière dont le modèle de langage réalise des tâches professionnelles (analyser un contrat, écrire du code, structurer des données…).
GPT-5.2 à la traîne
Avec de tels résultats, Gemini démontre qu’il est enfin parvenu à rattraper son retard avec ChatGPT, voire même à le surpasser. GPT-5.2 n’a réussi à rivaliser avec Gemini Pro 3.1 dans aucun des benchmarks réalisés par la startup IA Mercor, preuve s’il le fallait de la toute-puissance de Gemini.
Dans un contexte où les modèles de langage pullulent et où la concurrence est féroce, trois entreprises tentent de tirer leur épingle du jeu : Google, OpenAI et Anthropic. Chacune cherche à rendre son modèle plus autonome, à proposer un agent capable d’enchaîner plusieurs actions sans perdre le fil et, surtout, à orienter leur IA vers la productivité professionnelle.
🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.