Un apprentissage approfondi permet de colorer avec précision les lames de biopsie numérique

Les lames de biopsie tissulaire colorées à l’aide de colorants d’hématoxyline et d’éosine (H&E) sont une pierre angulaire de l’histopathologie, en particulier pour les pathologistes qui doivent diagnostiquer et déterminer le stade des cancers. Une équipe de recherche dirigée par des scientifiques du MIT au Media Lab, en collaboration avec des cliniciens de la faculté de médecine de l’université de Stanford et de la faculté de médecine de Harvard, montre maintenant que les scans numériques de ces lames de biopsie peuvent être colorés par calcul, en utilisant des algorithmes d’apprentissage profond formés sur les données des lames physiquement colorées.
Les pathologistes qui ont examiné les images des diapositives H&E colorées par calcul dans le cadre d’une étude en aveugle n’ont pas pu les distinguer des diapositives traditionnellement colorées tout en les utilisant pour identifier et classer avec précision les cancers de la prostate. De plus, les diapositives pourraient également être « dé-colorées » par calcul de manière à les remettre dans leur état d’origine pour les utiliser dans des études futures, concluent les chercheurs dans leur étude du 20 mai publiée dans Réseau JAMA.
Ce processus de coloration et de décoloration numérique par ordinateur préserve de petites quantités de tissus biopsiés de patients cancéreux et permet aux chercheurs et aux cliniciens d’analyser des lames pour de multiples types de tests de diagnostic et de pronostic, sans avoir besoin d’extraire des sections de tissus supplémentaires.
« Notre développement d’un outil de décoloration pourrait nous permettre d’étendre considérablement notre capacité à effectuer des recherches sur des millions de lames archivées avec des données de résultats cliniques connues », déclare Alarice Lowe, professeur agrégé de pathologie et directrice du laboratoire des cellules tumorales circulantes de l’université de Stanford, qui était co-auteur de l’article. « Les possibilités d’appliquer ce travail et de valider rigoureusement les résultats sont vraiment illimitées ».
Les chercheurs ont également analysé les étapes par lesquelles les réseaux neuronaux d’apprentissage profond ont coloré les lames, ce qui est essentiel pour la traduction clinique de ces systèmes d’apprentissage profond, explique Pratik Shah, chercheur principal au MIT et auteur principal de l’étude.
« Le problème est un tissu, la solution est un algorithme, mais nous devons aussi ratifier les résultats générés par ces systèmes d’apprentissage », dit-il. « Cela permet d’expliquer et de valider les essais cliniques randomisés des modèles d’apprentissage profond et leurs résultats pour des applications cliniques ».
Les autres contributeurs du MIT sont le premier auteur et associé technique Aman Rana (maintenant chez Amazon) et le post-doc Akram Bayat du MIT dans le laboratoire de Shah. Des pathologistes de la Harvard Medical School, du Brigham and Women’s Hospital, de la Boston University School of Medicine et du Veterans Affairs Boston Healthcare ont assuré la validation clinique des résultats.
Création de diapositives « frères et soeurs
Pour créer des lames colorées par ordinateur, Shah et ses collègues ont formé des réseaux neuronaux profonds, qui apprennent en comparant des paires d’images numériques de lames de biopsie avant et après la coloration H&E. C’est une tâche qui convient bien aux réseaux neuronaux, a déclaré M. Shah, « car ils sont assez puissants pour apprendre une distribution et une cartographie des données d’une manière que les humains ne peuvent pas bien apprendre ».
M. Shah appelle ces paires « frères et soeurs », notant que le processus forme le réseau en leur montrant des milliers de paires de frères et soeurs. Après la formation, dit-il, le réseau n’a besoin que des « frères et sœurs peu coûteux et largement disponibles et faciles à gérer », c’est-à-dire des images de biopsie non colorées, pour générer de nouvelles images colorées par calcul, ou à l’inverse, lorsqu’une image colorée par un colorant H&E est virtuellement dé-tachée.
Dans l’étude actuelle, les chercheurs ont formé le réseau en utilisant 87 000 patchs d’images (petites sections de l’ensemble des images numériques) scannés à partir de tissus prostatiques biopsiés de 38 hommes traités au Brigham and Women’s Hospital entre 2014 et 2017. Les tissus et les dossiers médicaux électroniques des patients ont été désidentifiés dans le cadre de l’étude.
Lorsque Shah et ses collègues ont comparé pixel par pixel des images régulièrement colorées et des images colorées par calcul, ils ont constaté que les réseaux de neurones effectuaient une coloration virtuelle H&E précise, créant des images qui étaient de 90 à 96 % similaires aux versions colorées. Les algorithmes d’apprentissage en profondeur ont également permis d’inverser le processus, en dé-colorant les diapositives colorées par calcul pour les ramener à leur état d’origine avec un degré de précision similaire.
« Ces travaux ont montré que les algorithmes informatiques sont capables de prendre de manière fiable des tissus non colorés et de réaliser des colorations histochimiques en utilisant la méthode H&E », explique M. Lowe, qui ajoute que ce processus « prépare également le terrain » à l’utilisation d’autres colorations et méthodes analytiques que les pathologistes utilisent régulièrement.
Les diapositives colorées par calcul pourraient aider à automatiser le processus long de coloration des diapositives, mais M. Shah a déclaré que la capacité à détacher et à préserver les images pour un usage futur est le véritable avantage des techniques d’apprentissage approfondi. « Nous ne résolvons pas seulement un problème de coloration, mais aussi un problème de préservation des tissus », a-t-il déclaré.
Les logiciels en tant que dispositifs médicaux
Dans le cadre de l’étude, quatre pathologistes experts certifiés et formés par le conseil d’administration ont étiqueté 13 séries de lames colorées par ordinateur et colorées de manière traditionnelle afin d’identifier et de classer les tumeurs potentielles. Lors de la première série, deux pathologistes choisis au hasard ont reçu des images colorées par calcul, tandis que les deux autres pathologistes ont reçu des images colorées par colorant H&E. Après une période de quatre semaines, les séries d’images ont été échangées entre les pathologistes, et une autre série d’annotations a été effectuée. Les annotations faites par les pathologistes sur les deux séries de diapositives se chevauchaient à 95 %. « Les lecteurs humains ne pouvaient pas les différencier », dit Shah.
Les évaluations des pathologistes à partir des lames colorées par calcul concordent également avec la majorité des diagnostics cliniques initiaux figurant dans le dossier médical électronique du patient. Dans deux cas, les chercheurs ont constaté que les images colorées par ordinateur avaient infirmé les diagnostics initiaux.
« Le fait que des diagnostics plus précis aient pu être rendus sur des images colorées numériquement témoigne de la grande fidélité de la qualité de l’image », explique M. Lowe.
Une autre partie importante de l’étude a consisté à utiliser de nouvelles méthodes pour visualiser et expliquer comment les réseaux de neurones ont assemblé des images colorées et dé-colorées par calcul. Cela a été fait en créant une visualisation et une explication pixel par pixel du processus à l’aide de cartes d’activation des modèles de réseaux neuronaux correspondant aux tumeurs et à d’autres caractéristiques utilisées par les cliniciens pour les diagnostics différentiels.
Ce type d’analyse permet de créer un processus de vérification nécessaire à l’évaluation des « logiciels en tant que dispositifs médicaux », explique M. Shah, qui travaille avec la Food and Drug Administration américaine sur les moyens de réglementer et de traduire la médecine computationnelle en applications cliniques.
« La question est de savoir comment mettre cette technologie au service des milieux cliniques afin d’en faire profiter au maximum les patients et les médecins. dit Shah. « Le processus de diffusion de cette technologie comprend toutes ces étapes : données de haute qualité, informatique, explication du modèle et performance de l’analyse comparative, visualisation des images et collaboration avec les cliniciens pour de multiples séries d’évaluations ».
L’étude du réseau JAMA a été soutenue par le consortium Media Lab et le département de pathologie du Brigham and Women’s Hospital.