Intelligence artificielle : AlphaGo battu par… AlphaGo

source Intelligence artificielle : AlphaGo battu par… AlphaGo:





Une nouvelle version du programme de Google a écrasé la précédente. Avec une innovation : elle n'a pas appris grâce aux humains.

Au jeu de go, l'homme est définitivement sorti du cadre. AlphaGo, le super-ordinateur qui avait fait sensation l'an dernier en battant le champion du monde de go, est tombé sur plus fort que lui : il vient d'être largement battu par une nouvelle version du programme.

AlphaGo Zero, ce nouveau programme « plus puissant », victorieux sur le score sans appel de 100 à 0, « est sans doute le plus fort joueur de go de l'histoire », estiment Demis Hassabis et David Silver, deux de ses concepteurs, dans une étude publiée mercredi dans la revue Nature.

Un jeu particulièrement difficile

Au jeu de go, le nombre de combinaisons possibles est astronomique, plus grand que le nombre d'atomes dans l'univers. Les programmes informatiques, bien que très forts en calcul, ne peuvent donc pas passer en revue toutes les possibilités pour choisir la bonne mais doivent imiter les concepts stratégiques de l'homme.

2016 : Google devient maître du go
Pour battre en 2016 Lee Se-Dol, grand maître sud-coréen du jeu de go (par quatre parties à une), AlphaGo avait été nourri des milliers de parties jouées par des professionnels et des amateurs, lui permettant ainsi « d'apprendre », pendant plusieurs mois, à copier le raisonnement humain par l'apprentissage profond (deep learning, en anglais).

La victoire d'AlphaGo sur Lee Se-Dol l'an dernier avait fait sensation : c'était la première fois qu'un logiciel écrasait un joueur chevronné lors d'un match entier.

AlphaGo Zero a appris tout seul

AlphaGo Zero, également développé par DeepMind, une filiale britannique de Google spécialisée dans l'intelligence artificielle, est doté d'une innovation majeure : il est capable « d'apprendre tout seul à jouer au go », précise l'étude.

Pour s'entraîner, AlphaGo Zero joue contre lui-même, « en partant de 0 » sans autre connaissance sur le go que les règles du jeu. Contrairement à AlphaGo, il n'a donc pas eu besoin de se confronter à des humains pour devenir imbattable. « Après trois jours d'entraînement (presque 5 millions de parties, ndlr) en autodidacte, il a battu la version de 2016 d'AlphaGo », expliquent Demis Hassabis et David Silver sur un blog.

« La nouveauté c'est que AlphaGo Zero soit si bon »

Et alors qu'AlphaGo nécessitait plusieurs machines, son successeur fonctionne avec une seule. « Ce n'est pas le premier logiciel qui apprend par lui-même, la nouveauté c'est que AlphaGo Zero soit si bon », souligne le futurologue Anders Sandberg, de l'Université d'Oxford.



Dans certains domaines, les connaissances peuvent être difficiles à réunir voire inexistantes. Il est alors difficile de « nourrir » les logiciels d'exemples et de données pour leur permettre de s'entraîner. L'auto-apprentissage permet de sauter cette étape parfois difficile à mettre en place.

Mais si elle peut se passer avec succès de l'expérience humaine pour se perfectionner, la machine dépend néanmoins toujours de l'intelligence des hommes : « les brillantes idées qui ont permis d'améliorer le programme ont été générées par l'homme », précise Anders Sandberg. « AlphaGo ne se programme pas tout seul ! »


En savoir plus sur https://www.lesechos.fr/idees-debats/sciences-prospective/030744604725-intelligence-artificielle-alphago-battu-par-alphago-2123550.php#vVrycy4BcrihMYtd.99
'via Blog this'

Popular posts from this blog

L’AVIATION israélienne a simulé une attaque contre l’Iran

Les data centers de Google consomment plus de 16 milliards de litres d’eau par an