L’informatique en sciences de la Terre : une voie non linéaire

L’apprentissage machine est indéniablement un outil que la plupart des disciplines aiment avoir dans leur boîte à outils. Cependant, les scientifiques continuent d’étudier les limites et les obstacles à l’intégration de l’apprentissage machine dans leur recherche. Junior Sonia Reilly a passé l’été à ouvrir la boîte noire de l’apprentissage automatique pour mieux comprendre comment l’information circule dans les réseaux neuronaux dans le cadre du programme Programme d’occasions de recherche de premier cycle (UROP). Son projet, qui étudie le fonctionnement de l’apprentissage automatique dans le but d’améliorer son application à l’observation des phénomènes naturels, a été supervisé par Sai Ravela dans le cadre du projet Département des sciences de la Terre, de l’atmosphère et de la planète (EAPS). En tant que spécialiste du cours 18C (Mathématiques et informatique), Reilly est particulièrement bien équipé pour aider à l’étude de ces connexions.
« Ces dernières années, l’apprentissage en profondeur est devenu un outil extrêmement populaire dans toutes sortes de domaines de recherche, mais les mathématiques qui expliquent comment et pourquoi il est si efficace sont encore très mal comprises « , dit Reilly. « Avoir cette connaissance permettra de concevoir des machines d’apprentissage plus performantes. » Pour ce faire, elle examine de plus près la façon dont les algorithmes évoluent pour produire leurs conclusions finales les plus probables, dans le but ultime de fournir des renseignements sur la circulation de l’information, les goulots d’étranglement et de maximiser le gain tiré des réseaux neuronaux.
« Nous ne voulons pas nous noyer dans de grandes données. Au contraire, nous voulons transformer de grandes données en ce que nous pourrions peut-être appeler des données intelligentes « , dit Ravela sur la façon dont l’apprentissage automatique doit se dérouler. « L’objectif final est toujours un agent de détection qui recueille des données de notre environnement, mais qui est axé sur les connaissances et qui fait juste assez de travail pour recueillir juste assez d’information pour faire des déductions significatives.
Pour Ravela, qui dirige l’équipe de la Groupe Signaux et systèmes de terre (ESSG), des machines d’apprentissage plus performantes signifient des prévisions précoces plus robustes des catastrophes potentielles. Les recherches de son groupe portent en grande partie sur le fonctionnement de la Terre en tant que système, principalement axé sur le climat et les risques naturels. Ils observent les phénomènes naturels pour produire des modèles prédictifs efficaces des processus naturels dynamiques, comme les ouragans, les nuages, les volcans, les tremblements de terre, les glaciers et les stratégies de conservation de la faune, ainsi que pour faire des progrès en ingénierie et en apprentissage.
« Dans tous ces projets, il est impossible de recueillir des données denses dans l’espace et le temps. Nous montrons que l’exploitation active de l’environnement par le biais d’une approche analytique des systèmes est prometteuse « , dit-il. Ravela a récemment présenté les derniers travaux de son groupe – y compris les contributions de Reilly – au groupe d’intérêt spécial de l’Association of Computing Machinery sur la découverte des connaissances et le data mining (SIGKDD 2019) début août. Il enseigne un cours decours infini »avec une duologie des cours enseignés au printemps et à l’automne qui donne un aperçu des bases de l’apprentissage machine pour les sciences des systèmes naturels, que n’importe qui peut suivre en ligne.
Selon Ravela, si Reilly veut réussir à faire progresser la base mathématique des modèles d’apprentissage computationnel, elle sera l’une des » premières pionnières de l’apprentissage qui peuvent être expliquées « , une réalisation qui peut offrir un cheminement professionnel prometteur.
C’est idéal pour les objectifs de Reilly d’obtenir un doctorat en mathématiques après avoir obtenu son diplôme du MIT et de rester un contributeur à la recherche qui peut avoir un impact positif dans le monde. Elle commence par faire le maximum de recherches qu’elle peut gérer dans son emploi du temps au cours de ses deux dernières années d’études de premier cycle au MIT, y compris son expérience cet été.
Bien qu’il s’agisse de la première expérience UROP de Reilly, c’est la deuxième fois qu’elle entreprend un projet de recherche qui combine les mathématiques, l’informatique et les sciences de la Terre. Auparavant, au Laboratoire de physique appliquée de l’Université Johns Hopkins, M. Reilly a aidé à mettre au point des techniques et des logiciels de traitement du signal qui permettraient d’améliorer la récupération d’informations utiles sur le changement climatique à partir de données satellitaires de faible qualité.
« J’ai toujours voulu faire partie d’un milieu de recherche interdisciplinaire où je pourrais utiliser mes connaissances en mathématiques pour contribuer au travail des scientifiques et des ingénieurs « , dit M. Reilly au sujet de son travail au sein des SPEA. « C’est encourageant de voir ce genre d’environnement et d’avoir un avant-goût de ce que ce serait de travailler dans un environnement. »
Ravela explique que l’ESSG apprécie l’inclusion mutuellement bénéfique des étudiants de l’UROP. « Pour moi, les UROP sont meilleures que les étudiants diplômés et les post-doctorants si, et seulement si, on peut créer des questions de la bonne taille pour qu’ils puissent y répondre. Mais alors ils courent le plus vite et sont les plus intelligents de tous. » Il estime que le programme UROP est inestimable et qu’il pourrait être avantageux pour tous les étudiants de s’y intégrer, car il leur offre la chance d’en apprendre davantage sur d’autres domaines et sur la recherche interdisciplinaire, ainsi que sur la façon d’intégrer ce qu’ils apprennent à des résultats concrets.
Pour Mme Reilly, la recherche s’appuie sur les bases qu’elle a acquises en suivant des cours au MIT, qui sont un environnement contrôlé et prévisible, dit-elle, » mais la recherche est loin d’être aussi linéaire « . Elle s’est appuyée sur les bases des mathématiques et de l’informatique qu’elle a acquises au cours de ses cours au cours de son expérience à l’UROP, tout en devant apprendre à les relier et à les appliquer à de nouveaux domaines et à envisager des sujets souvent en dehors de ses études de premier cycle. « J’ai souvent l’impression que chaque pas que je fais m’oblige à apprendre un tout nouveau domaine des mathématiques, et il est difficile de savoir par où commencer. Je me sens perdu parfois, mais j’apprends aussi beaucoup. »