📣 Avant de commencer
Nous allons jouer ensemble à un jeu appelé Hexapawn. Pourquoi ce nom ? « Hexa » signifie six et « pawn » pion en anglais. Ce jeu a été inventé en 1962 aux États-Unis par Martin Gardner, un vulgarisateur scientifique. Son but : montrer comment une machine peut apprendre à gagner, en s’améliorant progressivement. C’est une technique d’intelligence artificielle que l’on appelle le « machine learning » : littéralement, la machine apprend. Là où le jeu est intéressant, c'est qu'il n'utilise aucun ordinateur... que du papier !
Que vas-tu faire dans cette expérience ?
Pour ce jeu, nous allons créer une « machine » sous la forme de boîtes puis nous l’entraînerons à devenir imbattable. Ton terrain de jeu sera composé d’un plateau, de pions pour toi et pour la machine que tu vas affronter, et de boîtes contenant des jetons.
Chacune de ces boîtes représente une situation possible du jeu à chaque tour. Le jeton que tu y piocheras définira le coup joué par l’IA. Tu vas voir, c’est très facile ! Petit à petit, tu découvriras son fonctionnement… et verras qu’elle apprend en jouant contre toi !
Alors, prêt/e à créer ta propre IA ?
🛠️ Le matériel dont tu as besoin
Nous t'avons préparé un document à imprimer avec des patrons à découper, pour que tu puisses fabriquer toi-même tout le matériel de jeu dont tu as besoin.
Télécharge et imprime notre document
- 3 pions « humain » et 3 pions « IA »
- Un plateau de 3x3 cases
- 19 petites boîtes à découper, plier et coller
- 43 jetons de 4 types différents (19 avec 1 flèche >, 17 avec 2 flèches >>, 6 avec 3 flèches >>> et 1 avec 4 flèches >>>>)
- Des feuilles de papier A4 si possible légèrement cartonné pour imprimer les patrons, des ciseaux, de la colle, une imprimante.
Prépare le jeu
- Fabrique le matériel de jeu :
- Imprime notre document, idéalement sur du papier légèrement cartonné
- Découpe les pions, le plateau et les jetons
- Prépare les boîtes : découpe sur les traits pleins, plie sur les lignes en pointillé et colle les languettes
- Place à l’intérieur de chaque boîte un jeton pour chacune des flèches (>, >>, >>> ou >>>>) présente sur l’étiquette correspondante.
- Place au jeu !
⏱️ Temps de préparation : environ 60 minutes
⚙️ Les règles du jeu
Le but du jeu
Un joueur peut remporter la partie de 3 façons :
- il mange tous les pions de l’adversaire ;
- l'un de ses pions atteint la ligne de départ de son adversaire ;
- il bloque l'adversaire, qui ne peut plus avancer.
La mise en place du jeu
Place les trois pions « humain » (les tiens !) sur la ligne devant toi ; et les 3 pions de l'IA sur la ligne du haut.
Le déplacement et la capture des pions
À chaque tour, le joueur peut soit avancer l’un de ses pions, soit capturer un pion adverse.
- Pour avancer : un pion peut avancer uniquement vers l'avant et tout droit, jamais en diagonale, et à condition que la case soit vide.
- Pour capturer : un pion peut capturer un pion adverse en se déplaçant d'une case en diagonale, jamais tout droit. Il se place alors sur la case du pion « mangé », qui est défaussé.
Vidéo : notre médiateur scientifique Émilien t'explique tout !
(Médiateur du Palais de la découverte)
Bonjour scientifique en herbe.
Bienvenue dans Mes expériences à la maison.
Aujourd’hui, je vais te montrer comment jouer à un petit jeu appelé Hexapawn, contre une intelligence artificielle.
Et cette IA, c'est toi qui vas la construire... en papier !
Et tu vas lui apprendre à jouer, et même à gagner contre toi.
Pour le faire avec moi, tu peux télécharger et imprimer le matériel dans le lien en description.
Pour réaliser notre expérience, voilà ce dont tu as besoin :
un plateau de neuf cases, trois pions pour le joueur humain, trois pions pour l'IA, 19 petites boîtes, et 43 petits jetons avec une flèche, deux flèches, trois flèches et quatre flèches.
Les règles du jeu sont très simples.
Pour bien t'expliquer, en partant de l’angle du plateau en bas à gauche, on va appeler les colonnes A, B et C et les lignes 1, 2 et 3.
C'est toujours toi, l'humain, qui commences.
Chacun votre tour, toi et l'IA, vous avancez un de vos pions d'une case.
Il y a deux déplacements possibles :
Avancer tout droit sur une case vide. Ici, je fais avancer le pion de la case B1 en B2
Et avancer en diagonale sur une case avec un pion adverse pour le manger. Ici je fais avancer mon pion de la case B2 vers C3 et je retire le pion de l'IA du jeu.
Pour gagner : soit tu manges tous les pions de l'adversaire, soit l'un de tes pions atteint la ligne de départ de l’adversaire, soit tu le bloques, c'est-à-dire que ton dernier mouvement l'empêche de bouger à son tour.
Découvrons maintenant ton adversaire.
Pour créer l'IA contre laquelle tu vas jouer, tu as besoin des boîtes et des jetons dont on a parlé.
Pour préparer l'IA, c'est très simple : si tu regardes les boîtes, elles ont des dessins dessus.
Chaque dessin représente la position des pions sur le plateau après ton tour à toi,
et les différents déplacements possibles pour les pions de l'IA symbolisés par des petites flèches.
Et si tu retournes la boîte, il y a le même dessin en miroir.
Avant de commencer à jouer, il faut mettre les jetons dans les boîtes.
Dans chacune des boîtes, tu mets un jeton correspondant à chacun des déplacements que tu vois sur l'une des faces de la boîte.
Maintenant, faisons une première partie.
C'est moi, l'humain, qui commence à jouer.
Coup 1 : Ici, je choisis d'avancer le pion du milieu de B1 vers B2.
Maintenant, c'est au tour de l'IA.
Coup 2 : Pour commencer, il faut trouver la boîte qui correspond au plateau.
Ici, c'est le premier tour de l'IA, donc le deuxième coup de la partie.
Tu peux regarder les boites qui ont le numéro 2.
Ici, on en a deux.
Comme ce n'est pas à moi de choisir ce que joue l’IA, je vais laisser le hasard décider.
Pour ça, je la secoue pour mélanger les jetons et j'en pioche un, sans regarder à l'intérieur.
C'est le jeton avec deux petites flèches.
Ici, on regarde l'étiquette : Elle joue en déplaçant le pion A3 et vient manger le pion en B2.
Je mets la boîte de côté avec son jeton et j'applique le coup.
Coup 3 : C'est à moi de jouer et je vais prendre le pion en C1 et venir manger le pion en B2.
C'est à nouveau au tour de l'IA.
Coup 4 : Il faut trouver la boîte dont on a besoin.
Cette fois, tu peux chercher dans les boites avec un 4.
Si tu ne la vois pas, c'est peut-être parce que ton plateau est en miroir.
Pense à retourner tes boîtes. Pour moi, elle est ici.
Je mélange les jetons et j'en prends un au hasard.
Cette fois-ci, c'est avec une petite flèche.
Donc l’IA avance son pion de C3 vers C2.
Comme précédemment, je mets la boîte de côté et je joue le coup.
C'est à nouveau à moi.
Coup 5 : Je vais prendre le pion en A1 et l'avancer en A2.
C’est à l’IA de jouer.
Coup 6 : Je trouve la boîte, cette fois-ci dans les boîtes avec un 6.
Puisque c'est le sixième coup de la partie.
Je secoue et je prends un jeton au hasard.
Il y a deux petites flèches, donc il utilise son pion en B3 pour manger le pion en A2.
Comme tout à l'heure, je mets la boîte de côté et j'applique le coup.
Coup 7 : C'est mon tour et cette fois-ci, je vais terminer la partie en avançant mon pion en B2 pour aller en B3.
Comme c'est une case de départ des pions de l'adversaire, c'est moi qui ai gagné.
Et l’IA a perdu.
C'était une bien belle partie.
Maintenant, il faut que l'IA apprenne de ses erreurs.
Dans le cas où l'IA a perdu, comme ici, la règle, pour faire en sorte qu'elle apprenne, c'est de prendre la dernière boîte utilisée, et retirer le jeton sélectionné, celui qui l'a conduite à la défaite.
Une fois que tu l'as fait, tu peux remettre les autres jetons dans leur boîte. Et c'est tout.
Ça signifie qu'à la prochaine partie, elle ne pourra plus jouer ce coup qui l’a fait perdre dans celle-ci.
Dans le cas où l'IA a gagné la partie, c'est encore plus simple.
On remet tous les jetons dans leur boîte comme au début de la partie, pour qu'elle puisse de nouveau gagner.
Allez, maintenant, on fait plusieurs parties supplémentaires.
(ENTRAINEMENT DE L’IA)
(Plusieurs parties se déroulent en accéléré)
Voilà, on a fait quatre parties en tout.
Toujours avec les mêmes procédures d'apprentissage.
Et il y a des choses intéressantes à te montrer.
Regarde cette boîte.
En tant qu'humain, je sais que dans cette configuration, l'IA n'a aucune chance de gagner.
Quoi qu'elle fasse, je gagnerai toujours la partie.
(IA en A3 ; Joueur en B1, B2 et B3)
Et si on regarde à l'intérieur, il n'y a aucun jeton.
Quand on a utilisé cette boîte dans une partie précédente, l’IA a perdu et on a retiré l'unique jeton.
Maintenant, si on retombe sur cette boîte, il n'y a plus un jeton à l'intérieur.
L’IA ne peut donc plus jouer.
C'est un peu comme si elle déclarait forfait parce qu'elle était sûre de perdre.
Dans ce cas, c'est dans la boîte utilisée juste avant que l'on va retirer le jeton.
Plus globalement, au fur et à mesure des parties, on va retirer tous les jetons qui la font perdre.
À tel point qu'au bout d'un moment, généralement au bout d'une trentaine de parties, l’IA va devenir hyper forte.
Alors oui, tu l'auras compris, face à notre IA en papier, tu es condamné à perdre.
Mais c'est toi, en appliquant l'algorithme d'apprentissage qui le lui a appris.
Maintenant, c'est à toi de jouer.
Pour retrouver tout le matériel et en savoir plus, on se retrouve sur le site du Palais de la découverte.
(Retrouvez toute l’expérience et le matériel sur palais-découverte.fr)
(Palais de la découverte)
🚀 À toi de jouer !
📑 En résumé
- L’IA joue aléatoirement (au hasard), contrairement à toi qui suis une tactique.
- Quand l’IA remporte une partie, il n’y a rien à modifier puisque qu’elle a atteint l’objectif que nous lui avons fixé : gagner ! Tous les jetons sont remis dans leurs boîtes comme au début de la partie.
- Quand l’IA perd, elle n’atteint pas cet objectif. Il faut donc la corriger pour qu’elle « apprenne », en l’empêchant de jouer le coup qui l’a fait perdre. Le jeton qui l’a fait perdre est retiré du jeu.
- Une IA informatique suit le même fonctionnement que cette IA de papier, mais plus rapidement et avec plus d’étapes. C’est ce qu’on appelle du « machine learning » !
💡 L’explication scientifique
Qu’est-ce qu’un algorithme ? En quoi l’IA d’Hexapawn en suit-elle un ?
Un algorithme, c’est un peu comme une recette de cuisine ! Pour faire un gâteau, tu suis une série d'instructions : ajouter la farine, ajouter le beurre, mélanger les ingrédients, les mettre au four et attendre. En suivant ces étapes dans le bon ordre, tu atteins l'objectif recherché : un gâteau réussi.
L'IA d'Hexapawn te permet de voir un algorithme en action. Pendant une partie, tu joues le rôle d'un ordinateur qui exécute un algorithme, sans réfléchir : tu suis des instructions précises pour faire jouer l'IA, manipuler les boîtes, retirer ou laisser les jetons selon qu'elle perde ou gagne, dans un objectif : lui apprendre à gagner !
Qu'est-ce que le « machine learning » ?
Une intelligence artificielle (IA) est un système informatique qui imite certaines capacités humaines, comme reconnaître des paroles, des images, recommander des vidéos, écrire, mais aussi jouer à Hexapawn !
Les IA ont pour point commun de traiter une quantité importante d’informations pour apprendre à être efficaces sur une tâche spécifique. Pour cela, la plupart d’entre elles utilisent ce qu'on appelle le « machine learning », qui désigne les méthodes d’apprentissage d’une machine.
Mais cette méthode ne passe pas nécessairement par un ordinateur. En jouant à Hexapawn, l’IA a appris de ses erreurs sur le principe du « machine learning » sans aucun programme informatique, simplement avec du papier et avec tes mains !
Comment l'IA apprend-elle en jouant à Hexapawn ?
Imagine qu’une partie d’Hexapawn est représentée par un arbre, chaque coup possible par une branche. Les victoires ou défaites de l’IA sont les feuilles. Quand l'IA perd et que tu retires le dernier jeton utilisé pour réaliser l'apprentissage, tu coupes la branche qui contient une feuille « défaite ».
En répétant ces actions sur plusieurs parties, tu coupes petit à petit les branches qui mènent à des défaites, et, au fur et à mesure des parties, il ne reste donc que les feuilles « victoires ». Si tu joues suffisamment de parties contre l’IA, elle finira par ne jamais perdre !
🔍 Pour aller plus loin
Une autre intelligence artificielle, appelée MENACE, fonctionne de la même façon que l'IA d’Hexapawn. Elle est quant à elle capable d’apprendre à jouer au morpion. Elle est aussi constituée d'une boîte par situation du jeu, de jetons à l’intérieur. Mais, comme le morpion est plus compliqué qu’Hexapawn, pour y jouer, il faut pas moins de... 304 boîtes !
Si tu veux faire une partie de morpion contre MENACE, je te donne rendez-vous aux Étincelles du Palais de la découverte lors de l'exposé Intelligence Artificielle !
Crédit photo de Martin Gardner : Konrad Jacobs, Erlangen