Le robot-guépard pataud du MIT a appris à sprinter tout seul grâce à l'IA

Le robot-guépard pataud du MIT a appris à sprinter tout seul grâce à l’IA

Mini Cheetah, le robot quadrupède du MIT, a appris à se déplacer sur tous types de terrain lors d’un protocole d’entrainement strictement virtuel.

La robotique fait partie de ces champs de recherche qui ont fait des progrès spectaculaires depuis quelques années. On peut notamment citer Boston Dynamics, une entreprise américaine qui s’est illustrée avec d’incroyables machines comme l’humanoïde acrobate Atlas, ou encore Spot, le chien qui fait aujourd’hui partie des stars internationales de la robotique. Mais aujourd’hui, c’est un autre cyberquadrupède dont il est question; voici Mini Cheetah (“cyber guépard”), un quadrupède du MIT qui vient d’établir un record personnel assez impressionnant.

La première chose qui frappe lorsqu’on voit évoluer Mini Cheetah, c’est qu’il semble étonnamment pataud. En effet, le moins que l’on puisse dire, c’est qu’il est bien loin de posséder la grâce et la finesse dont est capable Spot, sans même parler de ses homologues biologiques; à la place, il gigote frénétiquement comme un chiot à qui on promet une friandise.

Il ne s’agit pas d’une erreur de programmation ou d’un manque de compétence des équipes du MIT, loin de là; si ses déplacements semblent si étranges, c’est parce que les différents mouvements n’ont jamais été programmés individuellement. En effet, la particularité de Mini Cheetah, c’est qu’il a appris à courir tout seul !

S'abonner à Journal du Geek

Un robot entièrement autodidacte

En effet, avant d’avoir droit à une présence physique, Mini Cheetah a passé les premiers moments de sa vie sous forme exclusivement virtuelle. 4000 versions numériques de l’engin ont été encouragées à explorer leur anatomie pour apprendre à se déplacer dans son environnement.

Et elles ont dû le faire en partant de zéro, sans le moindre exemple de mouvement tiré d’un vrai animal; on parle d’apprentissage par renforcement. C’est un peu comme un bébé que l’on inciterait à crapahuter en agitant un hochet; l’objectif est de l’encourager à explorer toutes les possibilités physiques que lui offre son corps afin qu’il trouve lui-même comment l’utiliser pour se déplacer.

Chaque modèle a donc développé sa propre façon de marcher, puis de courir; les chercheurs du MIT ont alors pu synthétiser les conclusions des plus prometteuses dans un modèle final qui a eu le droit de tester le fruit de son travail avec un vrai corps physique.

Autre différence fondamentale par rapport à de nombreux robots : Mini Cheetah ne dispose d’aucune caméra qui lui permettrait d’observer son environnement. Il se repose entièrement sur son ressenti et sur les réflexes qu’il a développés lors de l’entraînement; en puisant dans sa mémoire, il peut adapter sa course à des terrains plus ou moins réguliers, glissants, et ainsi de suite.

Spot est globalement plus impressionnant, mais il est bien incapable de sprinter de cette façon. © Boston Dynamics

Bancal en apparence, mais bougrement efficace

Certes, le résultat final ne transpire pas exactement l’élégance; mais en pratique, il est extrêmement solide, stable et polyvalent. Il est donc capable de se déplacer dans des environnements où d’autres robots quadrupèdes du même type auraient bien du mal à mettre une patte devant l’autre.

Malgré son nom, Mini Cheetah n’est pas non plus aussi rapide que ses homologues biologiques. Si ces derniers peuvent dépasser allègrement la centaine de kilomètres par heure; même s’il vient de battre son propre record, le robot se contente encore d’approcher les 15 km/h. Un chiffre impressionnant pour un robot de ce type; mais ces performances restent nettement inférieures à celles d’un autre robot guépard produit par Boston Dynamics, dont les pointes de vitesse sont comparables à celles d’Usain Bolt.

Mais le plus intéressant, c’est surtout la combinaison de ces deux derniers points dans un seul et même robot; il est à la fois auto-entraîné et rapide, ce qui représente un vrai changement de paradigme. Rien à voir avec à l’approche lente et minutieuse adoptée par la plupart des prototypes actuels. Et c’est en grande partie grâce à l’apprentissage autonome permis par l’IA; cette approche a permis d’optimiser le temps d’entraînement en ignorant tout ce qui ne permettait pas au robot d’avancer plus vite.

Et tant pis s’il a l’air maladroit, tant que le résultat est là ! “Plutôt qu’un humain qui déterminerait précisément comment le robot doit marcher, il apprend à partir de sa propre expérience dans le simulateur pour apprendre à se déplacer très, très rapidement”, explique Gabriel Margolis, l’un des chercheurs associés à l’étude.

S’émanciper des limites conceptuelles des humains

“Ce qu’on voit là, c’est l’un des principaux intérêts des systèmes à base de machine learning; ils sont très efficaces pour résoudre les problèmes spécifiques qu’on leur donne”, explique Tønnes Nygaard, un chercheur en robotique interviewé par Wired. “Dans ce cas, l’algorithme trouve la façon la plus rapide de faire courir le robot, même s’il a l’air bancal”, précise-t-il.

Mais surtout, cette approche n’est pas seulement fonctionnelle, mais aussi plus rapide que le développement “à l’ancienne”. En effet, il serait tout simplement impossible pour des ingénieurs de programmer individuellement tous les cas de figure rencontrés par Mini Cheetah lors de son auto-entraînement virtuel.

Et cette approche peut être appliquée à la quasi-totalité des systèmes touchés par le machine learning; si l’on accepte de sacrifier toutes les contraintes pratiques et ergonomiques, l’ IA finira très probablement par atteindre son but. Et il y a même peut-être une petite leçon de vie qui se cache derrière ce constat : parfois,il est absolument indispensable de sortir des sentiers battus.

“Les chercheurs humains sont limités par leur propre conception de ce qui constitue une “bonne” course. Ces critères peuvent se baser sur de vieilles traditions, sur les travaux des autres chercheurs, sur la nature, ou même une sur une préférence subconsciente pour la symétrie ou la beauté”, explique Nygaard à Wired. “Mais ces critères limitent souvent notre approche et donnent de moins bons résultats !”, conclut-il. À bon entendeur !

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.