Rho-alpha (ρα) est le premier modèle de robotique issu de la famille Phi, ces modèles « légers » que Microsoft développe depuis plusieurs mois. Ici, il ne s’agit plus seulement de comprendre des images ou du texte, mais de passer à l’action. Le modèle appartient à la catégorie des « vision-language-action » (VLA) : il perçoit son environnement, raisonne à partir d’instructions verbales, puis pilote directement les mouvements du robot.
Des robots avec un coup de pouce humain
Dans les faits, Rho-alpha est pensé pour des tâches de manipulation à deux bras. Un opérateur peut lui dire quoi faire en langage naturel, et le système traduit cette consigne en signaux de contrôle. Ashley Llorens, à la tête de Microsoft Research Accelerator, parle d’un modèle « VLA+ ». Il va en effet plus loin que ses prédécesseurs en élargissant à la fois les sens et les capacités d’apprentissage.
La grande nouveauté, c’est l’intégration du toucher. Là où beaucoup de robots se fient surtout à la vision, Rho-alpha ajoute une perception tactile, avec l’ambition d’y greffer ensuite la mesure de la force ou d’autres signaux physiques. Résultat : des gestes plus précis, plus souples, et surtout plus faciles à ajuster lorsqu’un objet ne se comporte pas exactement comme prévu.
Former un robot à « sentir » le monde réel pose un problème très concret : les données manquent. Les informations tactiles, en particulier, sont rares et difficiles à collecter à grande échelle. Microsoft a donc opté pour une approche hybride qui combine des démonstrations physiques, des tâches simulées et des données issues du web, notamment des jeux de questions-réponses visuelles.
La simulation est au cœur du dispositif. Grâce au framework Isaac Sim de Nvidia, les chercheurs génèrent des données synthétiques via des scénarios d’apprentissage par renforcement. « La téléopération n’est pas toujours possible », rappelle Abhishek Gupta, professeur à l’University of Washington, qui travaille avec Microsoft Research. La simulation permet donc d’élargir rapidement les cas d’usage sans avoir à utiliser en permanence des robots physiques.
Même avec tout ça, les erreurs restent inévitables. Microsoft ne s’en cache pas et mise sur l’humain pour remettre le robot sur les rails. À l’aide d’outils comme une souris 3D, un opérateur peut corriger un geste en direct. L’intérêt, c’est que Rho-alpha est conçu pour apprendre de ces ajustements et affiner son comportement au fil du temps. Actuellement testé sur des configurations à deux bras et sur des robots humanoïdes, le modèle fait encore l’objet d’évaluations. Microsoft ouvre tout de même déjà la porte aux industriels et intégrateurs avec un programme d’accès anticipé.
🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.