Passer au contenu

La nouvelle IA de DeepMind apprend des jeux sans en connaître les règles

Après avoir excellé aux échecs et au go, DeepMind est de retour, cette fois avec un algorithme capable d’apprendre lui-même les règles des jeux auxquels il s’essaie. 

Crédits Stevepb via Pixabay

C’est un nouveau pas de plus dans le domaine de l’intelligence artificielle. Popularisée avec l’IA AlphaGo en 2016, qui avait réussi l’exploit de battre Lee Sedol, le plus grand joueur de sa génération, DeepMind a poursuivi inlassablement sa progression. Alors que la première version d’AlphaGo avait “appris” à jouer en observant des matchs amateurs et professionnels, AlphaGo Zero sorti un an plus tard, s’était formé en jouant contre lui-même. Encore un peu plus tard, c’est l’IA AlphaZero qui voyait le jour. Capable de jouer aux échecs, au shogi et au go avec un seul algorithme, le programme semblait avoir atteint une nouvelle étape dans le domaine de l’intelligence artificielle. Cette fois, l’IA d’Alphabet a encore frappé très fort, en présentant au grand public son dernier algorithme baptisé MuZero, capable de jouer aux échecs, au go, au shogi et à plusieurs jeux Atari… sans avoir à en connaître les règles.

Aussi efficace que les précédentes IA de DeepMind, le secret de MuZero réside dans son apprentissage automatique. En effet, contrairement à AlphaGo ou à AlphaZero, ce dernier possède un algorithme capable de s’adapter à une situation qu’il ne connaît pas, et ainsi anticiper les règles du jeu en opérant plusieurs simulations, rapporte le site d’Engadget. Une nouvelle approche baptisée recherche anticipée, qui pourrait bien pousser l’IA à un niveau encore jamais atteint.

Grâce à cette nouvelle approche, l’IA pourrait ainsi être en mesure de surpasser la méthode lookahead, qui consiste à jouer un coup en anticipant les potentielles réactions adverses. Plutôt que de modéliser toutes les conséquences possibles d’une action — ce qui peut s’avérer presque impossible dans un jeu aux règles complexes, MuZero va ainsi prendre en compte uniquement les facteurs les plus importants (position actuelle, coup précédent et meilleure chance de victoire), rapprochant sa “réflexion” de celle d’un véritable être humain.

[amazon box=”B086GT4BDH”]

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Source : Engadget

1 commentaire
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *