Ok

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies. Ces derniers assurent le bon fonctionnement de nos services. En savoir plus.

10/03/2016

Deux à zéro...

 

CLAUDE TOUZET

"Une bonne partie du cerveau d’AlphaGo fonctionne grâce au Deep Learning (en bref, des algorithmes capables de modéliser des abstractions). Avant, les robots utilisaient principalement des réseaux neuronaux. Aujourd’hui, c’est le Deep Learning. Le robot analyse la situation et tente de déterminer ce que va faire l’autre. À chaque étape du jeu, il peut intégrer de nouvelles règles.
Le Deep Learning ne fait pas toujours tout cependant. Le robot réfléchit aussi grâce à un système expert, qui raisonne selon des règles connues. AlphaGo alterne entre les deux, selon les étapes du jeu.
Pour les imprévus, c’est-à-dire pour chaque coup, car chaque plateau de Go est différent, il peut aussi utiliser la méthode de Monte-Carlo. Celle-ci porte le nom d’un casino, car en l’appliquant, AlphaGo utilise des coups aléatoires dans ses simulations pour déterminer leur viabilité, pour voir si les appliquer est la bonne marche à suivre. Bien sûr, ça se combine aux “souvenirs” du robot, de ses expériences de jeu passé."

source

Les commentaires sont fermés.