L’IA de DeepMind et OpenAI surpasse les humains à Pong et Enduro

Une IA développée par Google DeepMind et OpenAI vient d’apprendre à jouer à neuf jeux d’Atari 2600, principalement en observant des joueurs humains. Et vous savez quoi ? Pour huit des neuf jeux, l’IA est meilleure que l’homme, et pour eux d’entre eux, dont le célèbre Pong, elle a atteint des capacités décrites comme « surhumaines ».

l'IA DeepMind atteint des performances surhumaines au jeu Pong

Les IA (intelligences artificielles) qui jouent à des jeux et surpassent l’homme, on connait depuis un certain temps. Le plus grand exploit en la matière est l’écrasante victoire de l’IA AlphaGo au jeu de Go réalisé en 2015 par Google DeepMind. Aujourd’hui encore, c’est de cette filiale de Google dont il est (en partie) question.

Un système d’IA utilisant deux méthodes d’apprentissage en simultané

Cette fois-ci, DeepMind et OpenAI annoncent avoir appris à jouer à neuf jeux de la console Atari 2600 (dont le célèbre Pong) à une IA en observant des humains jouer. Le système d’IA d’apprentissage en profondeur (deep learning) a compris la mécanique de jeu de Pong et d’Enduro par auto-apprentissage.L’IA a même présentés des capacités surhumaines sur deux des neufs jeux observés: Pong et Enduro.

L’intelligence artificielle mise au point par les chercheurs combinait deux types d’apprentissage en parallèle : un réseau neuronal d’apprentissage profond, devant observer et imiter le jeu humain, et un réseau neuronal convolutif, apprenant à l’IA à jouer par un test suivi système de punition/récompense

La première technique d’apprentissage utilisée ici à un nom : « inverse reinforcement learning« , autrement dit de l’apprentissage par renforcement inverse. Cette méthode d’apprentissage fait ici preuve d’une grande efficacité dans un cas où l’objectif à atteindre est difficilement définissable pour l’IA. La prouesse est que l’IA ne s’est pas contentée d’imiter et de comprendre la mécanique de jeu des joueurs humains : elle l’a fait évoluer et l’a améliorée pour atteindre des performances décrites comme nettement supérieures par les scientifiques.

L’IA ne s’en sort pas avec le jeu Private Eye

Après 50 millions d’étapes, l’IA formée a dépassé l’homme pour tous les jeux (dont Pong, mais aussi Hero, Montezuma’s Revenge, Beamrider, Breakout, Enduro, Q*bert et Seaquest), sauf pour le jeu Private Eye où l’homme garde l’avantage (pour le moment du moins…).