De quoi AlphaGo Zero est-il le progrès ?
Dans une percée historique récente (octobre 2017) l’algorithme AlphaGo Zero mis au point par DeepMind est parvenu à maîtriser le jeu de Go à un niveau suprahumain sans l’aide d’aucune supervision humaine. Pour parvenir à cette prouesse, AlphaGo Zero combine de manière astucieuse trois techniques classiques de l’IA : l’apprentissage par renforcement, la recherche arborescente et l’apprentissage profond. Nous expliquerons comment ces différents éléments s’articulent au sein de l’algorithme AlphaGo Zero et nous examinerons ses atouts et ses limitations. Enfin, nous évoquerons une application à moyen terme de ce type d’algorithme au problème du repliement des protéines, l’un des Graal de la recherche biomédicale actuelle.