Accueil🇫🇷Chercher

Intelligence artificielle dans le jeu vidéo

Dans le domaine du jeu vidéo, l'intelligence artificielle est utilisée pour proposer une expérience de jeu de qualité, par exemple en conférant aux personnages non-joueurs un comportement s'approchant de celui de l'être humain, d'une interaction logique, ou en limitant les compétences du programme afin de donner au joueur un sentiment d'équité.

Implémentations

Jeux de tir à la première personne

En 2018, une équipe de chercheurs de Google DeepMind affirme sur son blog[1] avoir conçu un programme d'intelligence artificielle capable de battre les champions humains du jeu vidéo de tir à la première personne Quake III, en utilisant les bots (les robots) intégrés au jeu[2]. Le mode choisit était le CTF (Capture the flag, « capture du drapeau » en français) : dans ce mode, le but du jeu est de récupérer le drapeau de la base ennemie pour le ramener dans sa propre base, tout en défendant son propre drapeau des assauts ennemis[3].

N'ayant reçu aucune information avant de commencer Ă  jouer, ces robots (nommĂ©s « agents coopĂ©ratifs complexes » par Deepmind)[3] ont jouĂ© des milliers de parties entre eux, apprenant de leurs erreurs pour perfectionner leurs tactiques[2] (« comment voir, agir, coopĂ©rer et concourir dans des environnements invisibles, le tout Ă  partir d’un seul signal de renforcement par match » disant aux agents s'ils avaient gagnĂ© ou non)[3]. Ă€ chaque nouvelle partie, une nouvelle map (zone de jeu)[alpha 1] Ă©tait gĂ©nĂ©rĂ©e automatiquement (de manière procĂ©durale)[1], permettant de compliquer la tâche aux bots. Les trente bots se sont affrontĂ©s sur un demi-million de parties (450 000)[3], afin de maĂ®triser l’environnement et les diffĂ©rentes tactiques et stratĂ©gies inhĂ©rentes au jeu[2] - [3]. Selon les chercheurs : « Grâce Ă  de nouveaux dĂ©veloppements dans l’apprentissage par renforcement, nos agents ont atteint des performances de niveau humain dans Quake III Arena CTF, un environnement multi-agents complexe et l’un des jeux multijoueurs cultes en 3D Ă  la première personne. Ces agents dĂ©montrent leur capacitĂ© Ă  faire Ă©quipe avec d’autres agents artificiels et des joueurs humains »[3]. Pour Deepmind, « les agents n’ont jamais Ă©tĂ© informĂ©s des règles du jeu, mais ont appris ses concepts fondamentaux et [ont] dĂ©veloppĂ© efficacement une intuition pour le CTF »[3].

Au lieu de former un seul agent, les chercheurs ont entraĂ®nĂ© « une population d’agents » qui apprenaient en jouant les uns avec les autres, fournissant ainsi « une diversitĂ© de coĂ©quipiers et d’adversaires »[3]. Chaque agent dans la population possède « son propre signal de rĂ©compense interne, ce qui permet aux agents de gĂ©nĂ©rer leurs propres objectifs internes, comme la capture d’un drapeau »[3]. « Un processus d’optimisation Ă  deux niveaux optimise les rĂ©compenses internes des agents directement pour gagner », en se servant de l’apprentissage par renforcement[3]. Selon les chercheurs, « les agents opèrent Ă  deux Ă©chelles de temps, rapide et lent, ce qui amĂ©liore leur capacitĂ© Ă  utiliser la mĂ©moire et Ă  gĂ©nĂ©rer des sĂ©quences d’actions cohĂ©rentes »[3]. Selon un graphique de progression dĂ©voilĂ© par Deepmind[1], les agents dĂ©passaient dĂ©jĂ  le niveau des joueurs humains moyens après 150 000 parties[3].

Par la suite, un tournoi est organisĂ© entre des binĂ´mes de machines contre des binĂ´mes humains (40 joueurs humains)[3], ainsi que des duos mixtes humains/machines entre eux[2]. Selon DeepMind, les Ă©quipes de bots atteignirent un taux de victoire probable de 74 %. En comparaison, les très bons joueurs humains n’ont atteint que 52 % de taux de victoire[2]. Les Ă©quipes composĂ©es d'agents uniquement sont restĂ©es invaincues lors de leurs confrontations avec Ă©quipes composĂ©es exclusivement d’humains. Les duo d'agents avaient 95 % de chances de gagner contre des Ă©quipes humains/agent artificiel[3].

Par ailleurs, les chercheurs ont observé que la probabilité de victoire par les bots baissait si le nombre de membres dans l'équipe augmentait. Cela s'explique par le fait que l'intelligence artificielle apprend à jouer au jeu en solo, mais ne comprend pas encore complètement la notion de coopération, souvent capitale dans un jeu en équipe. Ce paramètre était l'un des objets de cette expérience, visant à améliorer la conscience collective des IA, ce qui est un point déterminant dans le développement d’une espèce[2].

Jeux de stratégie en temps réel

Le , Google DeepMind présente sur son blog AlphaStar[4], une intelligence artificielle dédiée au jeu de stratégie en temps réel StarCraft II qui a affronté deux joueurs humains lors d'un match retransmis en direct sur Internet. Durant cet évènement, AlphaStar bat deux joueurs professionnels, dont Grzegorz « MaNa » Komincz, de l'équipe Team Liquid, l'un des meilleurs joueurs professionnels au monde[5]. Le développement de cette intelligence artificielle a été permis par un partenariat entre Google DeepMind et Blizzard Entertainment, l'éditeur du jeu[6].

L'une des caractéristiques de cette intelligence artificielle est qu'elle propose une version implémentant un brouillard de guerre. C'est-à-dire que, contrairement aux personnages contrôlés par le jeu, l'intelligence artificielle n'a accès qu'aux informations auxquelles aurait accès un joueur humain. Par ailleurs, le nombre d'actions par minute d'AlphaStar était inférieur au nombre d'actions par minute de ses adversaires. Ce n'est donc pas la rapidité de jeu de l'IA, mais l'efficacité de sa stratégie qui aurait permis à AlphaStar de gagner, bien que cette question soit sujette à controverses[6].

Notes et références

Notes

  1. Une map simplifiée par rapport aux maps traditionnelles du jeu Quake III.

Références

Bibliographie

  • (en) Brian Schwab, The Psychology of Game AI, Cengage Learning, , 352 p. (ISBN 978-1-4354-6083-6 et 1-4354-6083-9)
  • (en) Ian Millington et John Funge, Artificial Intelligence for Games, Burlington, MA, Morgan Kaufmann, , 896 p. (ISBN 978-0-12-374731-0 et 0-12-374731-7, lire en ligne)

Articles connexes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.