Docs 1chercheur1manip

Des robots qui apprennent

Des robots qui apprennent

21 mars au 13 mai 2018

Aujourd'hui, il existe des robots dotés de capacités surpassant celles des humains pour certaines activités. Ces super-spécialistes ne peuvent toutefois faire face à une situation imprévue. Comment donner aux robots la capacité de s'adapter à des environnements variés et inconnus de leurs concepteurs ? C'est l'enjeu de la robotique dite développementale inspirée du développement des enfants, une branche de l'intelligence artificielle initiée à la fin des années 1990. 

Au cours des présentations, un bras articulé déplace un objet d'un point à un autre. En mode "automate", le robot répète le même geste avec plus ou moins de succès. En revanche, doté d'un algorithme inspiré de la robotique développementale, il est capable de localiser l'objet dans un périmètre donné avant de le déplacer.

En 4 photos

Stéphane Doncieux de l’Institut des systèmes intelligents et de robotique, et son équipe présentent leurs recherches en robotique développementale inspirée du développement des enfants.  Ces recherches sont menées dans le cadre du projet européen DREAM, un projet interdisciplinaire entre robotique et neurosciences. Elles visent à doter les robots de capacités d’apprentissage leur permettant de faire face à des situations inconnues. Ainsi, le robot pourrait comprendre seul ce qu'il peut faire, comment le faire, et accomplir sur demande des tâches domestiques par exemple.

L’approche "développementale" procède par étapes comme le font les enfants. Au cours d'une période de babillage, le robot apprend lentement avec peu de connaissances initiales sur son environnement. Peu à peu, son exploration lui permet de construire des cartes d’informations, sur la mobilité des objets par exemple. Ici les zones mobiles sont représentées en blanc et les zones indéplaçables en noir.

Les phases d'explorations alternent avec des phases de "sommeil" où le robot est déconnecté de son environnement. Il structure et ancre ses expériences, par exemple en effectuant des simulations de lancers de balle qui prendraient 60 fois plus de temps dans la réalité et solliciteraient à outrance sa mécanique. En une vingtaine d’heures seulement, il effectue 400 000 simulations, sauvegardées dans une carte de comportements (balle représentée en rouge, trajectoire en blanc, points d’impacts au sol en bleu clair).

Le robot utilise l’expérience acquise dans l’étape de babillage afin de produire des connaissances qu’il exploite ensuite pour apprendre plus efficacement. Par exemple, lorsque le robot essaye les lancers de balle précédemment simulés et que la balle tombe à côté du panier, il est capable de recalculer une meilleure trajectoire en peu de temps. Après une autre phase de consolidation des connaissances, le robot ne réapprendra pas de « zéro » face à une situation imprévue. Il arrivera en quelques essais à lancer la balle dans un panier placé en hauteur.

En compléments

Remerciements

Nous remercions le laboratoire des Systèmes Intelligents et de Robotique (ISIR) et tous les intervenants : Stéphane Doncieux, Alexandre Coninx, Léni Le Goff, Mehdi Khamassi, Pierre Luce Vayrac.

Retour en haut