L’informatique et la recherche de nouvelles planètes
Lorsque le MIT a lancé le MIT Stephen A. Schwarzman College of Computing cet automne, l’un des objectifs était de stimuler l’innovation en informatique dans toutes les écoles du MIT. Les chercheurs vont déjà au-delà des applications traditionnelles de l’informatique et utilisent ces techniques pour faire progresser toute une gamme de domaines scientifiques, de la médecine du cancer à l’anthropologie, en passant par la conception et la découverte de nouvelles planètes.
Le calcul s’est déjà avéré utile pour le satellite de levé Exoplanet en transit (TESS), une mission financée par la NASA et dirigée par le MIT. Lancé à partir du cap Canaveral en avril 2018, TESS est un satellite qui prend des images du ciel en orbite autour de la Terre. Ces images peuvent aider les chercheurs à trouver des planètes en orbite autour d’étoiles au-delà de notre Soleil, appelées exoplanètes. Ce travail, qui est maintenant à mi-parcours, permettra d’en savoir plus sur les autres planètes de ce que la NASA appelle notre « voisinage solaire ».
« Le TESS vient d’achever la première de sa mission de deux ans, qui consiste à surveiller le ciel nocturne du sud, a déclaré Sara Seager, astrophysicienne et spécialiste des planètes au MIT et directrice adjointe des sciences pour le TESS. « Le TESS a trouvé plus de 1000 planètes candidates et une vingtaine de planètes confirmées, certaines dans plusieurs systèmes planétaires. »
Bien que le TESS ait permis des découvertes impressionnantes jusqu’à présent, la découverte de ces exoplanètes n’est pas une tâche facile. Le TESS recueille des images de plus de 200 000 étoiles lointaines, enregistre une image de ces planètes toutes les deux minutes, ainsi qu’une image d’une grande étendue de ciel toutes les 30 minutes. M. Seager indique que toutes les deux semaines, soit le temps qu’il faut au satellite pour orbiter autour de la Terre, le TESS envoie environ 350 gigaoctets de données (une fois non compressées) à la Terre. Bien que Seager affirme que ce n’est pas autant de données que ce à quoi les gens pourraient s’attendre (un Macbook Pro 2019 a jusqu’à 512 gigaoctets de stockage), l’analyse des données implique la prise en compte de nombreux facteurs complexes.
Mme Seager, qui s’intéresse depuis longtemps à la façon dont le calcul peut servir d’outil scientifique, a commencé à discuter du projet avec Victor Pankratius, ancien chercheur principal de l’Institut Kavli d’astrophysique et de recherche spatiale du MIT, qui est maintenant directeur et directeur du génie logiciel mondial chez Bosch Sensortec. Informaticien de formation, Pankratius dit qu’après son arrivée au MIT en 2013, il a commencé à penser aux domaines scientifiques qui produisent de grandes données, mais qui n’ont pas encore pleinement bénéficié des techniques informatiques. Après avoir parlé avec des astronomes comme Seager, il en a appris davantage sur les données recueillies par leurs instruments et s’est intéressé à l’application des techniques de découverte assistée par ordinateur à la recherche d’exoplanètes.
« L’univers est vaste », dit Pankratius. « Donc je pense que tirer parti de ce que nous avons du côté de l’informatique est une bonne chose. »
L’idée de base qui sous-tend la mission du TESS est que, comme notre propre système solaire, dans lequel la Terre et d’autres planètes tournent autour d’une étoile centrale (le soleil), il existe d’autres planètes au-delà de notre système solaire tournant autour de différentes étoiles. Les images que le TESS recueille produisent des courbes de lumière – des données qui montrent comment la luminosité de l’étoile change avec le temps. Les chercheurs analysent ces courbes de lumière pour trouver des baisses de luminosité, ce qui pourrait indiquer qu’une planète passe devant l’étoile et bloque temporairement une partie de sa lumière.
« Chaque fois qu’une planète est en orbite, vous verriez cette luminosité diminuer « , dit Pankratius. « C’est presque comme un battement de coeur. »
Le problème, c’est que chaque baisse de luminosité n’est pas nécessairement causée par le passage d’une planète. M. Seager indique que l’apprentissage machine entre actuellement en jeu pendant la phase de » triage » de l’analyse des données TESS, ce qui les aide à faire la distinction entre les planètes potentielles et d’autres choses qui pourraient causer des baisses de luminosité, comme les étoiles variables, qui varient naturellement dans leur luminosité ou le bruit des instruments.
L’analyse des planètes qui passent par le triage est encore effectuée par des scientifiques qui ont appris à « lire » les courbes de lumière. Mais l’équipe utilise maintenant des milliers de courbes de lumière qui ont été classées à l’œil nu pour enseigner aux réseaux neuronaux comment identifier les transits exoplanètes. Le calcul les aide à réduire les courbes de lumière qu’ils devraient examiner plus en détail. Liang Yu PhD’19, récemment diplômé en physique, a construit sur un code existant pour écrire l’outil d’apprentissage machine que l’équipe utilise maintenant.
Bien qu’il soit utile pour trouver les données les plus pertinentes, M. Seager affirme que l’apprentissage automatique ne peut pas encore être utilisé pour trouver simplement des exoplanètes. « Nous avons encore beaucoup de travail à faire, dit-elle.
Pankratius est d’accord. « Ce que nous voulons faire, c’est essentiellement créer des systèmes de découverte assistée par ordinateur qui le font pour tous (les étoiles) tout le temps « , dit-il. « Tu veux juste appuyer sur un bouton et me dire, montre-moi tout. Mais pour l’instant, ce sont encore des gens avec un peu d’automatisation qui contrôlent toutes ces courbes de lumière. »
Seager et Pankratius ont également co-enseigné un cours axé sur divers aspects du développement du calcul et de l’intelligence artificielle (IA) en science planétaire. Selon M. Seager, l’inspiration du cours est née de l’intérêt croissant des étudiants pour l’intelligence artificielle et ses applications dans le domaine de la science des données de pointe.
En 2018, le cours a permis aux étudiants d’utiliser les données réelles recueillies par le TESS pour explorer les applications de l’apprentissage automatique de ces données. S’inspirant d’un autre cours enseigné par Seager et Pankratius, les étudiants du cours ont pu choisir un problème scientifique et apprendre les compétences en calcul pour résoudre ce problème. Dans ce cas, les élèves ont appris les techniques d’IA et les applications du TESS. Seager dit que les élèves ont bien réagi à cette classe unique.
« En tant qu’étudiant, vous pourriez faire une découverte, dit M. Pankratius. « Vous pouvez construire un algorithme d’apprentissage machine, l’exécuter sur ces données, et qui sait, vous trouverez peut-être quelque chose de nouveau. »
Une grande partie des données que le SSEF recueille est également facilement accessible dans le cadre d’un projet scientifique plus vaste visant les citoyens. M. Pankratius dit que quiconque possède les bons outils peut commencer à faire ses propres découvertes. Grâce à la connectivité en nuage, c’est même possible sur un téléphone portable.
« Si tu t’ennuies en rentrant chez toi en bus, pourquoi ne pas chercher des planètes ? » dit-il.
M. Pankratius indique que ce type de travail de collaboration permet aux experts de chaque domaine de partager leurs connaissances et d’apprendre les uns des autres, plutôt que de se laisser entraîner dans le domaine de l’autre.
« Avec le temps, la science s’est spécialisée et nous devons donc trouver des moyens de mieux intégrer les spécialistes « , explique M. Pankratius. Le collège d’informatique pourrait aider à forger d’autres collaborations de ce genre, ajoute-t-il. M. Pankratius indique également qu’il pourrait attirer des chercheurs qui travaillent à l’intersection de ces disciplines et qui peuvent combler les lacunes dans la compréhension entre les experts.
Ce type de travail intégrant l’informatique est déjà de plus en plus courant dans les domaines scientifiques, note Seager. « L’apprentissage machine est à la mode en ce moment, dit-elle.
M. Pankratius affirme que c’est en partie parce qu’il est de plus en plus évident que l’utilisation des techniques informatiques est un moyen efficace de résoudre divers types de problèmes et d’accroître les ensembles de données.
« Nous avons maintenant des démonstrations dans différents domaines que l’approche de découverte assistée par ordinateur ne fonctionne pas seulement « , dit M. Pankratius. « Ça mène à de nouvelles découvertes. »