Une intelligence artificielle de DeepMind parvient à finir les 57 jeux de l’Atari 2600

Après le jeu d’échec ou de Go, les intelligences artificielles de DeepMind s’attaquent aux jeux vidéo. Après avoir fait ses preuves dans le domaine au fil des années, DeepMind révèle aujourd’hui que l’une de ses IA est parvenue à terminer les 57 jeux sortis sur Atari 2600, même les plus complexes.

Une Atari 2600 (Crédits : moparx / Flickr).

Une intelligence artificielle pourra-t-elle bientôt surpasser les meilleurs joueurs du monde même sur des jeux vidéo réputés pour leur difficulté, comme Sekiro : Shadows Die Twice ? Pour l’instant, elle n’en est qu’à maîtriser la deuxième génération du jeu vidéo, mais ses progrès actuels sont historiques. DeepMind, le laboratoire spécialisée en IA de Google, est parvenu à mettre au point une IA capable de maîtriser les 57 jeux parus sur Atari 2600, l’une des premières consoles de jeu vidéo dans les années 1970-1980, et à faire mieux que l’être humain. Comme le souligne fièrement DeepMind dans son rapport, cette IA nommée Agent57 est le “premier agent informatique à apprentissage par renforcement profond à obtenir un score au-delà de la moyenne humaine sur l’ensemble des 57 jeux de l’Atari 2600.”

Pour réussir à battre et finir bien plus de jeux que ses prédécesseurs, l’Agent57 s’est basée sur un modèle décisionnelle qui l’encourageait à observer le jeu et à tester une variété d’options avant de formuler une stratégie gagnante. Le rendu de cette dernière était ensuite jugé automatiquement par un “méta-contrôleur”, chargé en quelque sorte de peser le pour et le contre avant de poursuivre par de nouvelles observations ou un nouvel essai. L’objectif pour DeepMind est d’approcher le plus près possible de la conception d’une véritable intelligence artificielle générale. Cela signifie que, pour y arriver, ses scientifiques et ingénieurs doivent programmer et former l’IA la plus versatile et polyvalente possible, celle qui se révélera efficace dans la plus grande diversité de tâches possibles. Les jeux vidéo, même les plus primitifs, sont l’un des meilleurs moyens pour s’y essayer : si les contraintes techniques sont les mêmes, leurs fonctionnements diffèrent sur chaque titre. Agent57 s’est donc dévoilée non seulement aussi capable voire meilleur que l’intelligence humaine dans certains jeux mais est parvenue à passer d’un jeu à l’autre sans perdre en efficacité.

Agent57 jouant aux 57 jeux de l’Atari 2600

Agent57 face à ses quatre plus grands défis vidéoludiques

DeepMind note, enfin, que l’Agent57 a été le plus durement mise en difficulté par quatre jeux spécifiques. Montezuma’s Revenge et Pitfall l’auraient mis au défi de tester un grand nombre de stratégies avant d’obtenir une réussite et de maîtriser la meilleure méthode possible. De même, Solaris et Skiing auraient handicapé l’IA dans leur manque de feedback direct entre essai et résultat. Agent57 a, par conséquent, mis plus longtemps à apprendre les bonnes techniques. “L’Agent57 a été capable de s’améliorer en augmentant le nombre de simulations : plus elle s’entraînait longtemps, plus son score était élevée”, explique DeepMind. Le soucis, néanmoins, remarque MIT Technology Review, c’est qu’Agent57 a dû se ré-adapter à chaque jeu auquel elle jouait, qu’elle s’y soit déjà essayée ou non, comme si c’était la première fois qu’elle l’affrontait. L’être humain, à l’inverse, peut maîtriser plusieurs tâches ou jeux à la fois sans perdre en expérience ou en dextérité.

Atari Flashback 8 - Console...
223 Commentaires