[AlphaZero] Il n’a fallu que quelques heures à la nouvelle I.A. de Google pour martyriser un des plus puissants programmes d’Échecs

Intelligence artificielle

Par Fabio le

En octobre dernier, l’on apprenait l’existence de la petite sœur d’AlphaGo (l’I.A. qui a roulé sur tous les champions de Go en 2016), qui s’annonçait encore plus puissante que son aînée, notamment pour sa capacité à apprendre sans une aide humaine. AlphaZero vient de démontrer une partie de son potentiel sur un jeu d’Échecs.

Ce qui est impressionnant chez AlphaZero, c’est qu’elle n’a pas eu besoin d’emmagasiner des millions de parties humaines pour apprendre à maîtriser le jeu, contrairement à AlphaGo avec le jeu de Go. Seules les règles du jeu et la position des pièces sur le plateau lui ont suffit ; elle a alors pu enchaîner des millions de parties contre elle-même et progresser petit à petit. C’est ce qu’on appelle un apprentissage de renforcement général.

Des progrès fulgurants

Après neuf heures et 44 millions de parties “d’entrainement”, AlphaZero s’est donc mesurée à Stockfish, un puissant programme d’Échecs en open source. En quatre heures d’apprentissage, elle a pu résister au programme concurrent, et sur 100 matchs, elle en a gagné 28, concédant rien de moins qu’un nul sur les autres manches.

Au delà de son invincibilité, un des points les plus intéressants de sa performance réside dans le fait qu’AlphaZero n’avait pas besoin d’explorer une quantité très importante de coups, note Chess24. 80 000 positions étaient analysées par AlphaZero contre 70 millions pour Stockfish, AlphaZero étant capable, par son réseau neuronal, de réduire le corpus des coups pouvant être joués à ceux qui étaient les plus prometteurs.

Vers une intelligence artificielle plus fine

On se rapproche ici d’une intelligence humaine, qui pourrait ouvrir bien de nouvelles perspectives dans plein d’autres domaines, comme l’espèrent ses créateurs. Même si, comme l’expliquait Tristan Cazenave au journal Le Monde en octobre dernier, cette méthode d’apprentissage nécessite que le cadre soit très défini et que les règles soient claires et ne permettent pas d’imprévu.

Si vous voulez avoir plus de détails sur le duel entre AlphaZero et Stockfish, Chess24 a écrit un très éclairant compte-rendu.

Source: Source