DeepMind, la filiale d’Alphabet-Google spécialisée en intelligence artificielle, vient d’accomplir une nouvelle avancée avec son programme AlphaStar qui défie les humains à Starcraft II. Il a atteint le niveau “grand maître”, ce qui signifie qu’il est capable de battre 99,8 % de tous les joueurs humains en compétition. Les résultats ont été publiés dans un article de la revue scientifique Nature.
Starcraft II est ce que l’on appelle un jeu à information imparfaite, c’est-à-dire que les joueurs ne voient pas l’activité de l’adversaire qui est cachée sur la carte. Il n’existe aucune stratégie définitive pour l’emporter et le nombre de choix possibles est très élevé (1026).
Un algorithme pour exposer les failles adverses
Pour faire progresser AlphaStar, DeepMind a modifié sa méthode d’apprentissage par renforcement par laquelle le programme apprend à coups d’essais et d’erreurs en multipliant les parties contre lui-même avec deux algorithmes adverses. Mais au lieu que chaque algorithme cherche à maximiser ses chances de gagner, l’un était programmé pour exposer les failles dans la stratégie de l’autre. Une méthode inspirée des techniques d’entraînement des joueurs professionnels de Starcraft II.
Selon DeepMind, ces progrès laissent entrevoir la possibilité de créer des algorithmes plus généralistes, capables d’adapter leur apprentissage pour améliorer les performances des assistants numériques, des robots ou encore des voitures autonomes. (Eureka Presse)
Comments