jeu-go

En octobre 2015, l’intelligence artificielle AlphaGo a battu par 5-0 Fan Hui considéré comme le champion d’Europe du jeu de Go. Elle va affronter en mars prochain le 5ème meilleur joueur au monde, le Sud-Coréen Lee Sedol classé 9ème dan (plus haut niveau de Go) en direct sur Youtube.

AlphaGo, une IA développée par les ingénieurs de la branche Deepmind chez Google, est rentrée dans la légende comme son ainé le supercalculateur d’IBM, Deep Blue.

A l’époque Deep Blue avait réussi ce que beaucoup considère comme un exploit : battre le russe Kasparov, champion du monde d’échecs. Le jeu de go restait cependant encore un rêve inaccessible… Le nombre de coups possibles pour débuter une partie d’échecs est en effet limité à 20 coups. Dans une partie de Go, c’est une autre paire de manche. Il existe 361 coups possibles pour démarrer la partie.

Plus difficile que les échecs, le go est le plus ancien jeu combinatoire connu. Il est en effet apparu au VIIIème siècle avant JC et a traversé les siècles.

Le principe : deux joueurs s’affrontent dans une conquête de territoires sur un goban, un plateau de 19 lignes sur 19, soit 361 intersections. Le joueur doit placer ses pions sur ces intersections en encerclant ceux de son adversaire.

D’après Deepmind, la taille de ce Goban permet un nombre de combinaisons qui dépasse les possibilités de calcul des ordinateurs : il existe 10170 combinaisons soit plus de possibilités que… le nombre d’atomes dans l’univers.

Pour choisir l’action à effectuer, il y a bien sûr le calcul et la logique mais également l’intuition, l’anticipation, la prise de risques… Bref des facteurs très humains, difficilement intégrables dans une IA. Aussi, les scientifiques travaillant sur ce champ d’études cherchent à reproduire ces comportements via des logiciels ou algorithmes.

AlphaGo intègre ainsi plusieurs méthodes telles :

  • La méthode de simulation de Monte-Carlo, s’appuyant des lois de probabilité. Cette méthode a été mise au point par un chercheur Lillois : le mathématicien Rémi Coulom
  • La méthode d’apprentissage par renforcement mise au point par Yann LeCun, directeur du Centre de recherche en intelligence artificielle de Facebook à Paris, et professeur à l’université de New York.

La combinaison de ces méthodes permet ainsi à la machine de faire des actions, analyser leur impact et leur résultat et ainsi d’agir plus efficacement dans le futur.

Prochaine étape pour AlphaGo : un match en 5 manches contre Lee Sedol, actuellement 5ème mondial en jeu de go

Le gagnant remportera un chèque d’un million de dollars. Si AlphaGo sort vainqueur, le prix sera reversé à des associations

Pour ceux qui souhaitent visionner ce match, il sera retransmis en direct sur Youtube (attention au décalage horaire, le match se déroulant à Séoul, en Corée du Sud) les 9, 10, 12, 13 et 15 mars 2016. Nous devrions avoir plus d’informations prochainement.

Source : Maxisciences ; La Croix