StarCraft II : DeepMind, l'IA de Google, est parvenue à battre aisément deux joueurs pros

25 janvier 2019 à 10h38 dans Jeux vidéo

Année après année, Google ne cesse d'améliorer les capacités de DeepMind, son intelligence artificielle maison. Après lui avoir permis de lire sur les lèvres en 2016, la firme américaine s'est ensuite penchée sur ses capacités d'anticipation et de réaction. Pour les tester sur le terrain, DeepMind a affronté deux joueurs professionnels sur le jeu StarCraft II, visiblement dépassés par les tactiques de l'IA.

StarCraft II : DeepMind, l

Une IA surprenante

En décembre, Grzegorz “MaNa” Komincz et Dario “TLO” Wünsch affrontaient DeepMind, l'intelligence artificielle de Google. Le joueur qui remportait cinq parties repartait vainqueur de la confrontation. Confiants, les joueurs se sont toutefois fait surpasser. Un score final de 10-0 pour DeepMind, qui œuvrait ici derrière le pseudo "AlphaStar". Les matchs se déroulaient selon les paramètres suivants : Protoss vs Protoss, le tout sur la map Catalyst. Même si Protoss est la race préférée de MaNa, TLO partait avec un désavantage, préférant les Zerg. AlphaStar était également contraint à un délai de 350ms entre le moment où il percevait l'information et sa réponse, de manière à ce que les conditions ne soient pas inhumaines. L'APM moyen de l'IA était de 280, quand celles de MaNa et TLO étaient respectivement de 390 et 678. 

Malgré quelques actions pouvant être considérées comme des erreurs par des joueurs humains, comme ses sources de minerai saturées de sondes et un trop gros nombre de Disrupteurs, s'infligeant également des dégâts à ses propres unités, AlphaStar n'a laissé aucune chance à ses adversaires. Toutefois, à chaque partie, les joueurs pros étaient confrontés à un nouvel "agent" de DeepMind, une version de l'IA entrainée différemment. Autrement dit, à chaque partie, TLO et MaNa affrontaient un nouvel adversaire. D'autant plus que la source de ces agents, un réseau de neurones artificiels dont les informations ont été acquises par le biais de replays de matchs de StarCraft II, s'est ensuite divisée en une multitude de petits agents, qui se sont ensuite affrontés dans une compétition bien spécifique : l'AlphaStar League. En une semaine de compétition durant laquelle les IA se sont affrontées sans relâche, l'équivalent de 200 années humaines de matchs de StarCraft II ont été absorbées. 

L'IA voyait également une carte différente de celle des joueurs pros. Là où la carte est zoomée pour les joueurs humains, elle était complètement dézoomée pour AlphaStar, même si l'équipe de l'IA assure que les actions qui en découlaient pouvaient tout de même être considérées comme humaines. Et si DeepMind a explosé ses vis à vis, c'est majoritairement parce que "sa macro et sa prise de décision micro-stratégique étaient supérieures", assure son équipe. 

"J'étais impressionné de voir AlphaStar réaliser des actions avancées et différentes stratégies tout au long de chaque partie, et utiliser un gameplay très proche de celui d'un être humain. J'ai réalisé à quel point mon gameplay repose sur les erreurs faites par l'adversaire et l'exploitation des réactions humaines donc ça a mis le jeu sous une toute autre lumière pour moi." indique Komincz.

Après un Master en Journalisme à l'IEJ, j'intègre définitivement la rédaction d'Hitek en 2017. Passionné de jeux vidéo, de nouvelles technologies, de science-fiction et de pancakes, je me complais à partager mes centres d'intérêts avec le plus grand nombre. Toujours partant pour un Jägerbomb en terrasse.

Articles de Guillaume Chagot
Source(s) : Team Liquid Kotaku
count
Commentaires (17)
Ne l'approchez pas d'une machine à café svp
photo de profil de Billy Par Billy, il y a 6 ans Répondre
"L'APM moyen de l'IA était de 280, quand celles de MaNa et TLO étaient respectivement de 390 et 678"

quant je pense que j'ai du mal a atteindre les 60 APM dans ma ligue Gold...monde de merde
photo de profil de Garm Par Garm, il y a 6 ans Répondre
Je ne connais pas le jeu, mais je suis surpris de la différence entre les deux pros. Une explication quelqu'un ?
photo de profil de Jar-Jar Par Jar-Jar, il y a 6 ans (en réponse à Garm) Répondre
C'est la marco-gestion si tu veux c'est comme age of empire.
Pour atteindre autant d'action par minute généralement ces personne contrôle différemment chaque unité / groupes d'unité a une tache précise.
Sachant que chaque action a une répercussion sur les combat.
Par exemple tirer en statique peut te faire perdre un combat mais tiré reculer ou splité ses unité peut te permettre de gagner le même combat sans aucune perte
photo de profil de Nsn Par Nsn, il y a 6 ans (en réponse à Jar-Jar) Répondre
Beaucoup de joueurs pros font aussis "expres" de faire plus d'apm, en debuit de partie nottament , ou il n'y a pas autant de choses a gerer, certains switchent constament entre differents groups d'unites/ de batiments;
photo de profil de wasteak Par wasteak, il y a 6 ans (en réponse à Jar-Jar) Répondre
Ce n'est pas pour rien...

C'est pour garder une "dynamique" rapide et garder tes doigts "chaud" afin d'être toujours dans la même vitesse quand le micro management sera décisif.

Vois les APM en début de partie comme l'échauffement.
photo de profil de Blake Par Blake, il y a 6 ans (en réponse à wasteak) Répondre
Une moyenne d'APM ne représente pas la "qualité du joueur". Après bien sur, un pro en dessous de 300 APM est très rare mais pour le coup TLO avec ses 678 est très haut. De plus on parle d'action par minute, il faudrait comparer les EPM (en gros les actions utiles par minute) pour se rendre compte si c'est plus du spam ou non.
photo de profil de YellowFox Par YellowFox, il y a 6 ans (en réponse à Jar-Jar) Répondre
Tu as pleins de modes en arcade qui te permettent d'augmenter ton apm comme hotkeys trainer par exemple
photo de profil de Peteuncoup Par Peteuncoup, il y a 6 ans (en réponse à Garm) Répondre
Je suis désolé mais ce "match" est carrément pourri.
Déjà rien que le fait que l'IA est la vision complète de la map est totalement abusé comparé à la vision réduite des joueurs pros, avec une vision d'ensemble bien entendu que l'IA déjà de base va avoir une meilleur vision de la partie qu'eux.
"même si l'équipe de l'IA assure que les actions qui en découlaient pouvaient tout de même être considérées comme humaines" si il ont vraiment sorti ça c'est carrément du foutage de gueule en "on a permit à l'IA d'avoir un avantages monstrueux en terme de vision de jeu comparer aux joueurs mais vous inquiété pas ça va bien se passer" c'est vraiment du bullshit.

De plus l'échelle de d'entraînement est totalement stupide c'est quasi obligatoire que l'IA les explose si elle a accumulé l'équivalent de 200 ans de temps de jeu donc environ on est pas à une vache près 1 752 000 d'heure de jeu comparé au temps accumulé d'un joueur pro humain qu'on pourrait sans trop se planter à une moyenne de 24 000 heure si ils jouent 7 heures par jour sur une durée de 10 ans sans prendre un seul jour de repos.
Whoa génial! ce match de Starcraft II ça devait comme voir un match de gladiateur entre un nourrisson de 2 mois et un éléphant de guerre shooté à la cocaïne et au stéroïde.

Sans déconner il aurait du mettre des conditions équivalente à l'IA avec un temps de jeu similaire aux joueurs pros et avec les mêmes conditions de jeu,ça aurait était plus scientifiques que ce coup de com' putaclic de Google pour se faire mousser alors qu'à condition égal l'IA se serait certainement fait laver.
photo de profil de Lycarian Par Lycarian, il y a 6 ans Répondre
Pour la vision je tiens à préciser que c'est la taille de l'écran hein, pas le "brouillard de guerre", donc l'impact est très minime.

Les 200 ans c'est l'équivalent de toutes les parties des différentes IAs ensembles et cumulées (celles qui faisait partie de la ligue spéciale pour s’entraîner entre elles).

L'IA a fait moins d'actions par minute (APM) mais a été visiblement plus efficace que les humains vu qu'elle a quand même gagné 10 à 1.
photo de profil de Arikaran Par Arikaran, il y a 6 ans (en réponse à Lycarian) Répondre
Je te signale, que la carte dézoomé, tu l'as en bas à gauche, lopette
y'a aucun aventage à l'avoir en gros plan
l'ia de google était aussi contrainte par le brouillard de guerre
alors stop hate et va te detester toi même
photo de profil de shurath Par shurath, il y a 6 ans (en réponse à Lycarian) Répondre
Lycarian, je ne pense pas que la parfaite partialité du match soit un enjeu réel. Le coup de la vision c’est un peu abusé j’admet, mais l’important de la demarche est je pense de montrer les réelles avancées en terme de machine learning, un niveau de maitrise pareil pour un bot, meme avec une vision totale est deja une performance.
photo de profil de Garm Par Garm, il y a 6 ans Répondre
Bonjour,
l'article est un peu incomplet, il y a eu un autre match où Mana a gagné.
Ils disaient que la vision ne changeaient rien et pourtant ça a joué. Il y a eu une autre partie contre Mana et c'est le joueur qui a gagné. Grâce à sa stratégie ou à la différence de vision ? Surement les deux.
De plus, niveau stratégie c'était vraiment pas ouf, accumuler les traqueurs (une unité du jeu) alors que le joueur en face fait des unités qui contre ça... L'ia se reposait simplement sur sa microgestion (les traqueurs ont une compétence qui permets de renverser une fight avec une bonne micro) et sa macrogestion.
Sur le dernier match on a bien vu que l'ia était perdu quand le joueur envoyait une petite escouade dans la base principale (l'ia envoyait toute son armée au lieu d'un petit groupe).
De plus on parle de la moyenne d'APM et non pas du pic d'APM, l'ia qui monte à 1500 (d'après certains) sur 3 secondes de fight c'est juste inhumain et permets une micro parfaite donc une fois de plus le paramètre est biaisé.
Bref, impressionnant sur de nombreux points mais bien trop overhypped. Google sait vendre ses produits.
ps:de plus l'ia marche sur une seule carte dans un seul matchup, protoss versus protoss.
photo de profil de YellowFox Par YellowFox, il y a 6 ans Répondre
Une ia capable de battre un pro, c'est incroyable.
T'es juste un gros hater qui sait pas où voir l'info
photo de profil de shurath Par shurath, il y a 6 ans (en réponse à YellowFox) Répondre
Du tout, juste que je joue au jeu et que je ne m'arrête pas au côté démonstratif. On sait tous que les ia seront meilleures que les humains surtout si on ne mets aucune restriction.
Et du coup niveau info je me renseigne plus que toi, bien tenté quand même.

D'ailleurs je comprends pas trop pourquoi il ont fait jouer TLO (qui a un stylé très particulier) et dans une autre race que la sienne. J'aurais préféré voir un vrai protoss à sa place.
photo de profil de YellowFox Par YellowFox, il y a 6 ans (en réponse à shurath) Répondre
Shurath, déjà soit poli je pense pas que je t'ai insulté donc calme toi ça ne sert à rien qu'on commence une escalade d'insulte totalement puérile.

Le truc que je reproche à l'entraînement de l'IA c'est que c'est juste une accumulation en fast learning, les intelligences artificielles ont pas besoin à l'heure actuelle d'apprendre plus vite, elles ont besoin de mieux apprendre.

La parfaite impartialité, permet d'avoir des paramètres d'expériences valide permettant une véritable étude scientifique de ces matchs pour pouvoir améliorer les IA, là on à rien appris car les conditions pour mener l'expérience sont bancales avec un net avantage donné à l'IA, tout ça c'est juste Google qui veut se mettre en avant dans la course à l'intelligence artificielle.
et juste avoir la carte dans son ensemble en pouvant voir instantanément quelle unité apparaît et à quel endroit juste ça c'est donné la victoire à l'IA, pour donner un exemple tout con tu peux pas utiliser les changelings par exemple si je me rappelle bien il faut qu'il soit en visuel de sa cible pour se déguiser donc être visible sur la vision de l'ennemie aussi, et donc avec une vision d'ensemble de la map visible tu peux parfaitement le repérer et le tuer alors qu'avec une vision normale il serait peut-être passé entre les mailles du filets.
photo de profil de Lycarian Par Lycarian, il y a 6 ans Répondre
En vrai on s'en fout

DeepMind a rien inventé c'est juste une association de deux algorithme, dont je n'ai plus les noms, qui ont genre ente 20 et 10 ans

Ce qu'à réussi à faire Google c'est juste les associés (et tout le monde dans le "monde" des IA etc savaient que cette association était possible) et a ouvrir un serveur de 100 000 euros (chiffre donné au pif) pour qu'une putain d'IA apprenne à jouer au jeu de GO

Rien d'impressionnant en soit du coup ^^ Juste beaucoup d'argent et beaucoup de communication, comme Google sait bien le faire !

Ah et tout les algorithme sont dispo en source libre sur internet :)
photo de profil de Zackiel Par Zackiel, il y a 6 ans Répondre
Laisser un commentaire

Vous répondez à . Annuler