Une intelligence artificielle de DeepMind parvient à finir les 57 jeux de l’Atari 2600

Par Felix Gouty le 3 avril 2020 à 17h00

Après le jeu d’échec ou de Go, les intelligences artificielles de DeepMind s’attaquent aux jeux vidéo. Après avoir fait ses preuves dans le domaine au fil des années, DeepMind révèle aujourd’hui que l’une de ses IA est parvenue à terminer les 57 jeux sortis sur Atari 2600, même les plus complexes.

*Une Atari 2600 (Crédits : moparx /* Flickr).

Une intelligence artificielle pourra-t-elle bientôt surpasser les meilleurs joueurs du monde même sur des jeux vidéo réputés pour leur difficulté, comme Sekiro : Shadows Die Twice ? Pour l’instant, elle n’en est qu’à maîtriser la deuxième génération du jeu vidéo, mais ses progrès actuels sont historiques. DeepMind, le laboratoire spécialisée en IA de Google, est parvenu à mettre au point une IA capable de maîtriser les 57 jeux parus sur Atari 2600, l’une des premières consoles de jeu vidéo dans les années 1970-1980, et à faire mieux que l’être humain. Comme le souligne fièrement DeepMind dans son rapport, cette IA nommée Agent57 est le “premier agent informatique à apprentissage par renforcement profond à obtenir un score au-delà de la moyenne humaine sur l’ensemble des 57 jeux de l’Atari 2600.”

Pour réussir à battre et finir bien plus de jeux que ses prédécesseurs, l’Agent57 s’est basée sur un modèle décisionnelle qui l’encourageait à observer le jeu et à tester une variété d’options avant de formuler une stratégie gagnante. Le rendu de cette dernière était ensuite jugé automatiquement par un “méta-contrôleur”, chargé en quelque sorte de peser le pour et le contre avant de poursuivre par de nouvelles observations ou un nouvel essai. L’objectif pour DeepMind est d’approcher le plus près possible de la conception d’une véritable intelligence artificielle générale. Cela signifie que, pour y arriver, ses scientifiques et ingénieurs doivent programmer et former l’IA la plus versatile et polyvalente possible, celle qui se révélera efficace dans la plus grande diversité de tâches possibles. Les jeux vidéo, même les plus primitifs, sont l’un des meilleurs moyens pour s’y essayer : si les contraintes techniques sont les mêmes, leurs fonctionnements diffèrent sur chaque titre. Agent57 s’est donc dévoilée non seulement aussi capable voire meilleur que l’intelligence humaine dans certains jeux mais est parvenue à passer d’un jeu à l’autre sans perdre en efficacité.

Agent57 jouant aux 57 jeux de l’Atari 2600

S'abonner à Journal du Geek

Agent57 face à ses quatre plus grands défis vidéoludiques

DeepMind note, enfin, que l’Agent57 a été le plus durement mise en difficulté par quatre jeux spécifiques. Montezuma’s Revenge et Pitfall l’auraient mis au défi de tester un grand nombre de stratégies avant d’obtenir une réussite et de maîtriser la meilleure méthode possible. De même, Solaris et Skiing auraient handicapé l’IA dans leur manque de feedback direct entre essai et résultat. Agent57 a, par conséquent, mis plus longtemps à apprendre les bonnes techniques. “L’Agent57 a été capable de s’améliorer en augmentant le nombre de simulations : plus elle s’entraînait longtemps, plus son score était élevée”, explique DeepMind. Le soucis, néanmoins, remarque MIT Technology Review, c’est qu’Agent57 a dû se ré-adapter à chaque jeu auquel elle jouait, qu’elle s’y soit déjà essayée ou non, comme si c’était la première fois qu’elle l’affrontait. L’être humain, à l’inverse, peut maîtriser plusieurs tâches ou jeux à la fois sans perdre en expérience ou en dextérité.

[amazon box=”B06XVVSVWB”]

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.

𝕏

5 commentaires Signaler une erreur

Source : MIT Technology Review

Atari 2600 DeepMind Google

[Bon Plan] Profitez de 3 mois gratuits sur Amazon Music Unlimited !

Le CNC dévoile la liste des films concernés par la sortie anticipée en VOD

5 commentaires

Antholink Kiba dit :

4 avril 2020 à 7:03

En soi je vois pas trop en quoi c’est un exploit qu’une IA finisse des jeux, c’est même certainement plus facile pour une machine de gérer un logiciel que pour nous.

Répondre
GazetteSDF dit :

4 avril 2020 à 8:37

je pense qu’une IA serait peut être plus en mesure de gérer sur des Souls Like que sur d’autre type de jeux plus exotique dans le sens où les Souls Like reviennent sur des gameplay à pattern, comme les vieux 8/16Bit. Donc je ne sais pas si les IA gère bien la 3D mais au final, avec de l’apprentissage, l’IA devrait être en mesure de reconnaître les pattern mieux qu’un humain et aura naturellement un temps de réaction plus court.
Donc je pense que les IA seront en mesure de faire des SoulsLike peut être bien avant d’autre type de jeu

Répondre
GazetteSDF dit :

4 avril 2020 à 8:39

ce genre de jeu son de toute façon des jeux avec des gameplay assez basique qui fonctionne sur les réflexes et la concentration longue durée… tout ce qu’une IA peut gérer mieux que l’Homme, maintenir la concentration, c’est un programme et sur les réflexes, dès que l’analyse de l’action est faite, il l’exécute …

Répondre
Dral dit :

4 avril 2020 à 21:44

Ce qu’on dit rarement et qui semble rendre le challenge simpliste ou similaire à ce qui est codé directement dans les jeux vidéo, typiquement pour les comportements ennemis, c’est que l’IA n’a pas en entrée les informations du jeu, de la façon de jouer, les objectifs, les déplacements, etc. Son entrée, ce sont seulement les pixels de l’écran et les touches autorisées pour interagir avec le jeu. C’est là-dedans que réside la complexité de “comprendre” l’effet que ses décisions d’enfoncer telle ou telle touche peuvent avoir, et trouver un cheminement logique vers une récompense globale qui correspond à “gagner le jeu”.

Répondre
Jean-Dadou Delurbine dit :

6 avril 2020 à 14:55

“les” 57 jeux de l’atari 2600 ?? On va dire 57 des centaines de jeux que compte l’atari…

Et dans Pitfall par exemple… l’IA a juste survécu 20 minutes, ou bien elle a compris qu’il fallait choper la totalité des trésors, réalisable seulement en empruntant les bons sous terrains, avec changements de direction en surface ?

Répondre