La conférence annuelle des femmes en sciences des données aborde les fausses nouvelles
Qu’ont en commun les ondes de rayonnement provenant de l’espace, le recensement américain et le génome humain ? Ces trois éléments, comme tant d’autres aujourd’hui, impliquent des quantités massives de données. Ces données peuvent ouvrir des perspectives et conduire à de nouvelles solutions et à une meilleure prise de décision – pour ceux qui disposent des connaissances et des outils nécessaires à leur analyse.
L’impressionnante variété d’applications des outils et techniques des sciences des données a été présentée à la conférence « Women in Data Science » (WiDS Cambridge), qui s’est tenue au centre NERD de Microsoft début mars, avant que le MIT et le Commonwealth du Massachusetts ne commencent à se dédensifier en réponse à l’urgence de Covid-19. Co-organisée par l’Institute for Data, Systems, and Society (IDSS), le Harvard Institute for Applied Computational Science et Microsoft Research New England, WiDS Cambridge est l’un des dizaines d’événements WiDS par satellite organisés dans le monde entier. Le programme présente des femmes qui non seulement utilisent les outils de la science des données dans leur recherche ou leur entreprise, mais qui sont aussi des leaders qui perfectionnent ces outils et recrutent davantage de femmes dans ce domaine.
L’événement phare de la journée était une table ronde sur la science des données et les fausses nouvelles intitulée « Données militarisées, données scrutées : une guerre de l’information ». Le panel était animé par Manon Revel, une doctorante du programme IDSS Social and Engineering Systems (SES), dont les recherches ont analysé les pop-up pour voir comment l’exposition influence l’évaluation de la crédibilité des nouvelles par les lecteurs. Manon Revel a parlé des défis actuels : « Il est crucial de comprendre l’effet des fausses informations et de les combattre. Il faut pour cela réfléchir à la conception de la technologie, mais aussi au cadre réglementaire et au contexte politique et social ».
Le panel comprenait également Camille Francois, directeur de l’information pour Graphika, une start-up d’analyse de réseaux sociaux qui utilise l’IA pour comprendre les communautés en ligne. « Nous ne savons pas comment mesurer l’impact de l’ingérence étrangère pour de nombreuses raisons compliquées », a déclaré François. « Le but d’une campagne d’ingérence étrangère n’est pas nécessairement d’avoir un impact sur un vote. Il s’agit de diviser, de confondre et de créer le chaos. Comment mesurer le chaos ? »
En plus de la discussion sur la désinformation, WiDS Cambridge a présenté une grande variété de points de vue de l’industrie et du monde universitaire. Asu Ozdaglar, doyen adjoint des universitaires, chef du département de génie électrique et d’informatique, et membre du corps enseignant de l’IDSS et du laboratoire des systèmes d’information et de décision (LIDS), a souligné la robustesse de l’apprentissage machine. Citant l’exemple courant des erreurs des systèmes de classification d’images, elle a étudié comment des données « perturbées » peuvent, avec de petites variations, perturber des modèles par ailleurs précis, et a proposé une approche « minmax » utilisant des réseaux adversaires générateurs (GAN) pour accroître la robustesse.
Pour une perspective industrielle, Jess Stauth, directeur général de Fidelity Labs, a fourni des moyens d’appliquer les principes de recherche de base aux problèmes commerciaux modernes de la science des données. La science des données est un ensemble d’outils allant des statistiques à l’informatique, dit-elle, et les entreprises ont besoin d’une infrastructure pour les utiliser afin de créer une valeur commerciale tangible. « Un chercheur en sciences des données seul dans une pièce avec un ordinateur portable ne va probablement pas avoir beaucoup de succès », dit-elle.
La conférence a donné aux participants l’occasion de nouer des contacts et de rechercher des emplois, les entreprises sponsors organisant des tables de recrutement et répondant aux questions. Le WiDS a également permis aux nouveaux praticiens de se familiariser avec le sujet grâce à une séance d’affiches pour les étudiants et les post-doctorants et à des exposés éclair. Plus de 30 présentateurs de posters ont participé, présentant des travaux dans des domaines aussi divers que les biais démographiques dans le traitement du langage naturel, la prédiction de la criminalité, les maladies neurodégénératives et les bâtiments durables.
« Le WiDS est un événement merveilleux où vous pouvez interagir avec vos pairs, présenter vos recherches et renforcer votre confiance », déclare Marie Charpignon, étudiante en troisième cycle du programme de doctorat SES du MIT, qui a présenté un poster sur l’utilisation de l’inférence causale dans les dossiers médicaux électroniques pour étudier la possibilité de réorienter les médicaments contre le diabète pour traiter la démence. « La conférence réunit des étudiants, des professeurs, des chercheurs de l’industrie et même des investisseurs en capital-risque à la recherche d’idées prometteuses. Le WiDS vous donne une idée de la myriade de chemins que vous pourriez emprunter après l’obtention de votre diplôme ».