Mélanger Pokémon et étude de l'apprentissage profond des intelligences artificielles, c'est possible ! C'est le créateur de contenu Peter Whidden qui a entraîné une IA pendant des dizaines de milliers d'heures avant de lancer son propre programme. De quoi comprendre, un peu, comment fonctionne l'intelligence artificielle.
Le deep learning des intelligences artificielles, un concept encore en apprentissage
En quelques années, l’intelligence artificielle s’est popularisée. Dans le monde du jeu vidéo, elle est pourtant présente depuis des décennies : c’est elle qui génère le comportement des autres personnages dans des jeux multijoueurs comme Super Smash Bros ou Mario Kart. C’est aussi à elle que l’on doit le comportement des dresseurs que l’on affronte dans Pokémon. Mais c’est surtout celles pratiquant le deep learning qui émergent aujourd’hui : elles ont la capacité d’apprendre par elle-même des comportements à suivre, dans le cadre du code réalisé par son créateur.
Encore aujourd’hui toutefois, les IA deep learning fonctionnent de manière opaque. Elles affichent un processus de réflexion différent de l’humain. Dans le but de mieux comprendre la manière dont elles intellectualisent les choses, un créateur de contenu a décidé de faire une expérience mettant en scène une intelligence artificielle… à travers plusieurs parties dans Pokémon Rouge. Une vidéo très édifiante qui illustre bien les différences entre l’humain et la machine.
Le Centre Pokémon, une expérience traumatisante
Ainsi, Peter Whidden s’est retrouvé a entraîné une intelligence artificielle pendant 50 000 heures sur Pokémon pour essayer de comprendre le fonctionnement de celle-ci, d’étudier son comportement. Cela a pu donnerun algorithme capable d’explorer le jeu, de capturer des Pokémon et même de battre Pierre de la première arène ! Mais au-delà de ses exploits, il y a aussi beaucoup de ratés. Ces derniers viennent de l’objectif donné à l’IA : elle ne comprend que les données mathématiques. Impossible donc de lui dire de juste terminer le jeu comme on pourrait le faire avec un être humain.
Pour faire progresser son programme, Peter Whidden réfléchit alors à des objectifs pouvant se traduire par des valeurs. Par exemple, voir quelque chose de nouveau (un pixel différent) ou avoir un niveau total d’équipe conséquent. Cela a donc engagé l’intelligence artificielle à aller dans les hautes herbes, capturer des Pokémon et se balader toujours plus loin. Sauf qu’est venu un moment traumatisant pour celle-ci : le centre Pokémon. Si on trouve l’infirmière Joëlle toujours prête à soigner nos petits compagnons, il s’y trouve aussi les boîtes PC permettant d’interchanger ceux de notre équipe avec ceux stockés. Sauf que… cette dernière manipulation fait chuter le niveau total de l’équipe. L’IA n’est alors plus jamais retournée dans un centre Pokémon.
De manière assez surprenante, l’IA est tout de même parvenue à battre Pierre d’Argenta… seulement parce que Bulles d’O était la seule capacité restante à être encore utilisable. Mais elle ne verra jamais la seconde arène, située à Azuria : le Mont Sélénite fit office de point d’arrêt, la faute à ses chemins probablement trop similaire.
- Minecraft : un robot apprend à jouer avec 70,000 heures de vidéos Youtube, voici ce qu'il sait faire
Il y a aussi du bon !
S’il est facile de pointer du doigt ce que l’IA fait mal, il convient aussi de souligner ses qualités. Contrairement à l’être humain qui s’échine à percer les secrets de la RNG (de l’aléatoire en somme), elle a réussit à trouver “le truc”. Peter Whidden a découvert qu’elle prenait toujours le même chemin bizarre à la sortie de Bourg-Palette, le premier village du jeu. En réalité, cet itinéraire lui permet d’assurer la capture du prochain Pokémon avec seulement une Poké Ball.
Il y a donc du bon et du moins bon dans l’intelligence artificielle. Cet exercice réalisé par Peter Whidden rappelle à quel point il est difficile, même avec les bons objectifs en tête, de les traduire pour l’intelligence artificielle. À l’inverse, elle peut néanmoins nous apprendre des choses avec sa façon bien distincte de la nôtre. En tout état de cause, on reste encore bien loin des projets tout droit sortis d'œuvres de science-fiction.