Comment concevoir et contrôler des robots avec des corps extensibles et flexibles
Les chercheurs du MIT ont inventé un moyen d’optimiser efficacement le contrôle et la conception de robots logiciels pour des tâches cibles, ce qui a toujours été une entreprise monumentale en informatique.
Les robots doux ont des corps élastiques, flexibles et extensibles qui peuvent essentiellement se déplacer d’une infinité de façons à tout moment. Sur le plan du calcul, il s’agit d’une « représentation d’état » très complexe, qui décrit comment chaque partie du robot se déplace. Les représentations d’état pour les robots logiciels peuvent avoir des millions de dimensions potentielles, ce qui rend difficile le calcul de la manière optimale d’exécuter des tâches complexes pour un robot.
Lors de la Conférence sur les systèmes de traitement de l’information neuronale le mois prochain, les chercheurs du MIT présenteront un modèle qui apprend une représentation d’état compacte, ou » basse dimensionnelle « , mais détaillée, basée sur la physique sous-jacente du robot et son environnement, parmi d’autres facteurs. Cela aide le modèle à co-optimiser de façon itérative le contrôle des mouvements et les paramètres de conception des matériaux pour des tâches spécifiques.
« Les robots doux sont des créatures aux dimensions infinies qui se plient d’un milliard de façons différentes à un moment donné « , déclare le premier auteur Andrew Spielberg, un étudiant diplômé du Laboratoire d’informatique et d’intelligence artificielle (CSAIL). « Mais, en vérité, il existe des moyens naturels pour que les objets mous soient susceptibles de se plier. Nous trouvons que les états naturels des robots mous peuvent être décrits de façon très compacte dans une description à faible dimension. Nous optimisons le contrôle et la conception des robots logiciels en apprenant une bonne description des états probables. »
Dans les simulations, le modèle a permis aux robots logiciels 2D et 3D d’accomplir des tâches – telles que déplacer certaines distances ou atteindre un point cible – plus rapidement et plus précisément que les méthodes de pointe actuelles. Les chercheurs prévoient ensuite d’implémenter le modèle dans de vrais robots doux.
Se joindront à Spielberg pour cet article les étudiants diplômés de la CSAIL Allan Zhao, Tao Du et Yuanming Hu ; Daniela Rus, directrice de la CSAIL et titulaire de la chaire Andrew et Erna Viterbi en génie électrique et en informatique ; et Wojciech Matusik, professeur associé du MIT en génie électrique et informatique, chef du groupe Fabrication informatique.
Apprendre dans la boucle
La robotique douce est un domaine de recherche relativement nouveau, mais il est prometteur pour la robotique de pointe. Par exemple, les corps flexibles pourraient offrir une interaction plus sûre avec les humains, une meilleure manipulation des objets et une plus grande maniabilité, entre autres avantages.
Le contrôle des robots dans les simulations repose sur un « observateur », un programme qui calcule des variables qui voient comment le robot logiciel se déplace pour accomplir une tâche. Dans des travaux antérieurs, les chercheurs ont décomposé le robot souple en grappes de particules simulées conçues à la main. Les particules contiennent des informations importantes qui aident à réduire les mouvements possibles du robot. Si un robot tente de se plier d’une certaine manière, par exemple, les actionneurs peuvent résister suffisamment à ce mouvement pour qu’il puisse être ignoré. Mais, pour des robots aussi complexes, le choix manuel des clusters à suivre pendant les simulations peut s’avérer délicat.
En s’appuyant sur ces travaux, les chercheurs ont conçu une méthode d' » apprentissage en boucle « , où tous les paramètres optimisés sont appris au cours d’une seule boucle de rétroaction sur plusieurs simulations. Et, en même temps que l’apprentissage de l’optimisation – ou « dans la boucle » – la méthode apprend aussi la représentation de l’état.
Le modèle utilise une technique appelée méthode du point de matière (MPM), qui simule le comportement des particules de matériaux continus, tels que les mousses et les liquides, entourés d’une grille de fond. Ce faisant, il capture les particules du robot et de son environnement observable en pixels ou en pixels 3D, appelés voxels, sans qu’aucun calcul supplémentaire ne soit nécessaire.
Dans une phase d’apprentissage, cette information brute de la grille de particules est introduite dans un composant d’apprentissage machine qui apprend à entrer une image, à la compresser en une représentation à faible dimension et à décompresser la représentation en une image d’entrée. Si cet « encodeur automatique » conserve suffisamment de détails pendant la compression de l’image d’entrée, il peut recréer avec précision l’image d’entrée à partir de la compression.
Dans le travail des chercheurs, les représentations compressées apprises par l’autoencodeur servent de représentation de l’état à faible dimension du robot. Dans une phase d’optimisation, cette représentation comprimée est réintroduite dans le contrôleur, qui délivre un déclenchement calculé pour la manière dont chaque particule du robot doit se déplacer lors de la prochaine étape simulée en MPM.
Simultanément, le contrôleur utilise cette information pour ajuster la rigidité optimale de chaque particule afin d’obtenir le mouvement désiré. À l’avenir, ces informations sur les matériaux peuvent être utiles pour l’impression 3D de robots logiciels, où chaque point de particules peut être imprimé avec une rigidité légèrement différente. « Cela permet de créer des modèles de robots adaptés aux mouvements du robot qui seront pertinents pour des tâches spécifiques « , explique M. Spielberg. « En apprenant ces paramètres ensemble, vous gardez tout aussi synchronisé que possible pour faciliter le processus de conception. »
Optimisation plus rapide
Toutes les informations d’optimisation sont, à leur tour, renvoyées au début de la boucle pour former l’encodeur automatique. Au cours de nombreuses simulations, le contrôleur apprend la conception optimale du mouvement et du matériau, tandis que le codeur automatique apprend la représentation d’état de plus en plus détaillée. « La clé, c’est que nous voulons que cet état à faible dimension soit très descriptif « , dit M. Spielberg.
Une fois que le robot a atteint son état final simulé sur une période de temps donnée – disons, aussi proche que possible de la destination cible – il met à jour une « fonction de perte ». C’est un élément essentiel de l’apprentissage machine, qui tente de minimiser certaines erreurs. Dans ce cas, il minimise, disons, la distance à laquelle le robot s’est arrêté de la cible. Cette fonction de perte revient au contrôleur, qui utilise le signal d’erreur pour régler tous les paramètres optimisés afin d’accomplir au mieux la tâche.
Si les chercheurs essayaient d’introduire directement toutes les particules brutes de la simulation dans le contrôleur, sans l’étape de compression, » le temps de fonctionnement et d’optimisation exploserait « , explique M. Spielberg. En utilisant la représentation comprimée, les chercheurs ont pu réduire le temps d’exécution de chaque itération d’optimisation de plusieurs minutes à environ 10 secondes.
Les chercheurs ont validé leur modèle sur des simulations de divers robots bipèdes et quadrupèdes 2D et 3D. Les chercheurs ont également découvert que, alors que les robots utilisant des méthodes traditionnelles peuvent prendre jusqu’à 30 000 simulations pour optimiser ces paramètres, les robots formés sur leur modèle n’en ont pris qu’environ 400 simulations.
Déployer le modèle dans de vrais robots logiciels signifie s’attaquer aux problèmes avec un bruit et une incertitude du monde réel qui peuvent diminuer l’efficacité et la précision du modèle. Mais, à l’avenir, les chercheurs espèrent concevoir un pipeline complet, de la simulation à la fabrication, pour les robots doux.