Des étudiants de premier cycle développent des outils de renseignement de nouvelle génération
La pandémie de coronavirus nous a séparés physiquement tout en nous rappelant le pouvoir de la technologie pour nous connecter. Lorsque le MIT a fermé ses portes en mars, une grande partie du campus s’est mise à fonctionner en ligne, dans des classes, des laboratoires et des salles de discussion virtuels. Parmi ceux qui ont fait le pivot se trouvaient des étudiants engagés dans des recherches indépendantes dans le cadre du programme UROP (Undergraduate Research Opportunities Program) du MIT.
Grâce à des contrôles réguliers avec leurs conseillers via Slack et Zoom, de nombreux étudiants ont réussi à aller jusqu’au bout. L’un d’entre eux a même poursuivi ses expériences depuis sa chambre, après avoir ramené ses robots Sphero Bolt chez lui dans un sac à dos. « J’ai été très impressionnée par leur résistance et leur dévouement », déclare Katherine Gallagher, l’une des trois ingénieurs en intelligence artificielle du MIT Quest for Intelligence qui travaille avec les étudiants chaque semestre sur des applications liées à l’intelligence. « Il y a eu cette première semaine de folie, puis ils sont retournés au travail ». Quatre projets de ce printemps sont présentés ci-dessous.
Apprendre à explorer le monde avec les yeux et les oreilles ouverts
Pour se déplacer, les robots dépendent fortement des images diffusées par leurs caméras intégrées, ou « yeux » de substitution. Alon Kosowsky-Sachs, directeur du MIT, pense qu’ils pourraient faire beaucoup plus s’ils utilisaient aussi leurs « oreilles » de microphone.
Depuis sa maison de Sharon, dans le Massachusetts, où il s’est retiré après la fermeture du MIT en mars, Kosowsky-Sachs entraîne quatre robots Sphero Bolt de la taille d’une balle de base-ball à se déplacer dans une arène faite maison. Son objectif est d’apprendre aux robots à associer la vue et le son, et d’exploiter ces informations pour construire de meilleures représentations de leur environnement. Il travaille avec Pulkit AgrawalLe professeur assistant du département de génie électrique et d’informatique du MIT s’intéresse à la conception d’algorithmes avec une curiosité humaine.
Pendant que Kosowsky-Sachs dort, ses robots s’éloignent en glissant sur une patinoire qu’il a construite pour eux, deux par quatre. Chaque poussée de mouvement devient une paire de clips vidéo et audio d’une seconde. Le jour, Kosowsky-Sachs entraîne un modèle de « curiosité » visant à pousser les robots à devenir plus audacieux, et plus habiles, à naviguer sur leur parcours d’obstacles.
« Je veux qu’ils voient quelque chose à travers leur caméra, qu’ils entendent quelque chose dans leur microphone et qu’ils sachent que ces deux choses se passent ensemble », dit-il. « En tant qu’humains, nous combinons beaucoup d’informations sensorielles pour mieux comprendre le monde. Si nous entendons un coup de tonnerre, nous n’avons pas besoin de voir la foudre pour savoir qu’un orage est arrivé. Notre hypothèse est que des robots ayant un meilleur modèle du monde seront capables d’accomplir des tâches plus difficiles ».
Formation d’un agent robotisé pour concevoir un réacteur nucléaire plus efficace
Un facteur important qui détermine le coût de l’énergie nucléaire est la disposition du cœur du réacteur. Si les barres de combustible sont disposées de manière optimale, les réactions durent plus longtemps, brûlent moins de combustible et nécessitent moins d’entretien. Alors que les ingénieurs cherchent des moyens de réduire le coût de l’énergie nucléaire, ils se penchent sur la reconception du cœur du réacteur.
« L’énergie nucléaire émet très peu de carbone et est étonnamment sûre par rapport aux autres sources d’énergie, même solaire ou éolienne », déclare Isaac Wolverton, étudiant en troisième année. « Nous voulions voir si nous pouvions utiliser l’IA pour la rendre plus efficace. »
Dans un projet avec Josh Joseph, ingénieur en IA au MIT Quest, et Koroush ShirvanWolverton, professeur assistant au département de science et d’ingénierie nucléaires du MIT, a passé l’année à former un agent d’apprentissage du renforcement pour trouver la meilleure façon de disposer les barres de combustible dans le cœur d’un réacteur. Pour simuler le processus, il a transformé le problème en un jeu, empruntant une technique d’apprentissage par machine pour produire des agents aux capacités surhumaines aux échecs et au Go.
Il a commencé par former son agent à un problème plus simple : disposer des tuiles colorées sur une grille de façon à ce que le moins de tuiles possible de la même couleur se touchent. Au fur et à mesure que Wolverton augmentait le nombre d’options, passant de deux couleurs à cinq, et de quatre tuiles à 225, il devenait de plus en plus enthousiaste alors que l’agent continuait à trouver la meilleure stratégie. « Cela nous a donné l’espoir que nous pourrions lui apprendre à échanger les noyaux dans un arrangement optimal », dit-il.
Finalement, Wolverton s’est déplacé vers un environnement destiné à simuler un cœur de réacteur à 36 barres, avec deux niveaux d’enrichissement et 2,1 millions de configurations possibles du cœur. Avec l’aide des chercheurs du laboratoire de Shirvan, Wolverton a formé un agent qui est parvenu à la solution optimale.
Le laboratoire s’appuie maintenant sur le code de Wolverton pour essayer de former un agent dans un environnement grandeur nature de 100 bâtonnets avec 19 niveaux d’enrichissement. « Il n’y a pas de percée à ce stade », dit-il. « Mais nous pensons que c’est possible, si nous pouvons trouver suffisamment de ressources de calcul. »
Mettre davantage de foies à la disposition des patients qui en ont besoin
Environ 8 000 patients aux États-Unis reçoivent une greffe du foie chaque année, mais ce n’est que la moitié du nombre de ceux qui en ont besoin. Selon les chercheurs, beaucoup plus de foies pourraient être mis à disposition si les hôpitaux disposaient d’un moyen plus rapide de les dépister. En collaboration avec le Massachusetts General Hospital, le MIT Quest évalue si l’automatisation pourrait contribuer à augmenter le nombre de foies viables dans le pays.
Lorsqu’ils approuvent la transplantation d’un foie, les pathologistes estiment sa teneur en graisse à partir d’une tranche de tissu. S’il est suffisamment bas, le foie est considéré comme prêt pour la transplantation. Mais souvent, il n’y a pas assez de médecins qualifiés pour examiner les échantillons de tissus dans les délais serrés nécessaires pour faire correspondre les foies avec les receveurs. La pénurie de médecins, associée à la nature subjective de l’analyse des tissus, signifie que les foies viables sont inévitablement rejetés.
Cette perte représente une énorme opportunité pour l’apprentissage machine, déclare Kuan Wei Huang, étudiant de troisième année, qui a rejoint le projet pour explorer les applications de l’IA dans le domaine de la santé. Le projet consiste à former un réseau neuronal profond pour repérer des globules de graisse sur des lames de tissu hépatique afin d’estimer la teneur globale en graisse du foie.
Un des défis, selon M. Huang, a été de trouver comment gérer les variations dans la façon dont les différents pathologistes classifient les globules gras. « Il est donc plus difficile de savoir si j’ai créé les masques appropriés pour alimenter le réseau neuronal », dit-il. « Cependant, après avoir rencontré des experts dans ce domaine, j’ai reçu des éclaircissements et j’ai pu continuer à travailler ».
Formé sur des images étiquetées par des pathologistes, le modèle finira par apprendre à isoler seul les globules gras dans des images non étiquetées. Le résultat final sera une estimation de la teneur en graisse avec des images de globules gras surlignés montrant comment le modèle est arrivé à son compte final. « C’est la partie la plus facile : il suffit de compter les pixels des globules surlignés en pourcentage de la biopsie globale et nous avons notre estimation de la teneur en graisse », explique M. Gallagher, qui dirige le projet.
M. Huang se dit enthousiasmé par le potentiel du projet à aider les gens. « L’utilisation de l’apprentissage machine pour résoudre des problèmes médicaux est l’un des meilleurs moyens pour un informaticien d’avoir un impact sur le monde ».
Exposer les contraintes cachées de ce que nous voulons dire dans ce que nous disons
Le langage façonne notre compréhension du monde de manière subtile, avec de légères variations dans les mots que nous utilisons, qui véhiculent des significations très différentes. La phrase « Les éléphants vivent en Afrique et en Asie » ressemble beaucoup à la phrase « Les éléphants mangent des brindilles et des feuilles ». Mais la plupart des lecteurs concluront que les éléphants de la première phrase sont divisés en groupes distincts vivant sur des continents distincts, mais n’appliqueront pas le même raisonnement à la deuxième phrase, car manger des brindilles et manger des feuilles peut être vrai pour le même éléphant d’une manière que ne peuvent le faire les éléphants vivant sur des continents différents.
Karen Gu est diplômée en informatique et en biologie moléculaire, mais au lieu de mettre des cellules sous un microscope pour son projet SuperUROP, elle a choisi de regarder des phrases comme celles ci-dessus. « Je suis fascinée par les choses complexes et subtiles que nous faisons pour limiter la compréhension du langage, presque toutes inconsciemment », dit-elle.
Travailler avec Roger LevyGu, professeur au département du cerveau et des sciences cognitives du MIT, et MH Tessler, post-doctorant, ont examiné comment les connaissances préalables guident notre interprétation de la syntaxe et, en fin de compte, du sens. Dans les phrases ci-dessus, les connaissances préalables sur la géographie et l’exclusivité mutuelle interagissent avec la syntaxe pour produire différentes significations.
Après s’être plongée dans la théorie linguistique, Gu a construit un modèle pour expliquer comment, mot par mot, une phrase donnée produit du sens. Elle a ensuite mené une série d’expériences en ligne pour voir comment des sujets humains interpréteraient des phrases analogues dans une histoire. Ses expériences, dit-elle, ont largement validé les intuitions de la théorie linguistique.
L’un des défis, dit-elle, a été de devoir concilier deux approches pour l’étude des langues. J’ai dû trouver comment combiner la « linguistique formelle, qui applique une approche presque mathématique pour comprendre comment les mots se combinent, et la sémantique probabiliste-pragmatique, qui s’est davantage concentrée sur la façon dont les gens interprètent des énoncés entiers ». «
Après la fermeture du MIT en mars, elle a pu terminer le projet depuis la maison de ses parents à East Hanover, dans le New Jersey. « Les réunions régulières avec mon conseiller m’ont beaucoup aidée à rester motivée et sur la bonne voie », dit-elle. Elle dit qu’elle a également pu améliorer ses compétences en matière de développement web, ce qui lui sera utile lorsqu’elle commencera à travailler chez Benchling, une entreprise de logiciels basée à San Francisco, cet été.
Les projets Quest UROP du semestre de printemps ont été financés en partie par le Watson AI Lab du MIT-IBM et par Eric Schmidt, conseiller technique d’Alphabet Inc. et son épouse, Wendy.