Google réalise un nouvel exploit : on vivra bientôt avec des robots commandés par Gemini

Google continue d’avancer dans le développement de la version de Gemini pour la robotique. La version Gemini Robotics ER-1.6 permet aux robots d’accéder à un raisonnement avancé, et même de surveiller des instruments de mesure, comme les jauges et les niveaux de liquide, dans une usine.

Tout en continuant à améliorer le chatbot Gemini, Google a aussi un pied dans le monde des robots. Sa division IA, DeepMind, travaille sur des modèles d’IA spécialisés dans la robotique. Et, récemment, la firme a réalisé un nouvel exploit dans ce domaine, en développant une nouvelle version appelée Gemini Robotics ER-1.6, “une amélioration significative” de son modèle de raisonnement “qui permet aux robots de comprendre leur environnement avec une précision sans précédent”.

Par exemple, grâce aux nouvelles facultés de pointage, Gemini Robotics ER-1.6 permet aux robots de compter des objets, de comparer leur taille, ou encore de répondre à des prompts comme “montrez tous les objets suffisamment petits pour tenir dans la tasse bleue”. Par ailleurs, la nouvelle IA permet aussi aux robots d’accomplir des tâches qui nécessitent plusieurs étapes, ou l’utilisation d’outils. Si celle-ci a besoin d’une information pour accomplir la tâche confiée, elle peut carrément consulter le moteur de recherche de Google afin de trouver celle-ci.

Et, pour que les robots soient encore plus autonomes, Google a également développé la fonctionnalité de “détection de succès” sur le modèle Gemini Robotics ER-1.6. Pour cela, l’IA peut s’appuyer sur l’analyse des flux vidéo de plusieurs caméras, et faire le lien entre ces vidéos, pour évaluer si la tâche demandée a été correctement réalisée (par exemple : déterminer si un objet est bien rangé comme cela a été demandé).

The model knows when a task is complete to determine whether to retry it or move on – thanks to its multi-view reasoning and the ability to fuse live camera streams to understand a full scene.

Watch it process multiple angles to confirm if the job is done ↓ pic.twitter.com/yTBWnT65Xc

— Google DeepMind (@GoogleDeepMind) April 14, 2026

Gemini Robotics ER gagne aussi une compétence cruciale pour les applications industrielles

En collaboration avec Boston Dynamics, Google a aussi doté le modèle Gemini Robotics ER-1.6 d’une fonctionnalité qui augmente la fiabilité des robots dans la lecture des instruments de mesure (comme des jauges de pression, des indicateurs de niveau de liquide, etc.). Dans un premier temps, l’IA identifie l’instrument et fait un zoom dessus. Puis, celle-ci utilise ses facultés de pointage, de l’exécution de code, ainsi que ses connaissances, pour interpréter les indicateurs.

S'abonner à Journal du Geek

En tout cas, le résultat est que Google a pu créer un outil qui pourrait être utilisé pour faire des rondes dans les usines ou dans les complexes industriels, à la place des humains, et qui peut envoyer une alerte en cas d’anomalie constatée. “Des fonctionnalités telles que la lecture d’instruments et un raisonnement plus fiable sur les tâches permettront à Spot de voir, de comprendre et de réagir aux défis du monde réel de manière totalement autonome”, explique Marco da Silva, vice-président chez Boston Dynamics.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.