Utiliser l'apprentissage automatique pour estimer le risque de décès d'origine cardiovasculaire

Les humains sont intrinsèquement réticents à prendre des risques : Nous passons nos journées à calculer des itinéraires et des routines, à prendre des précautions pour éviter la maladie, le danger et le désespoir.

Pourtant, nos mesures pour contrôler les rouages internes de notre biologie peuvent être un peu plus indisciplinées.

C’est dans cet esprit qu’une équipe du MIT Laboratoire d’informatique et d’intelligence artificielle (CSAIL) a mis au point un nouveau système pour mieux prédire les résultats pour la santé : un modèle d’apprentissage automatique qui peut estimer, à partir de l’activité électrique du cœur, le risque de décès cardiovasculaire d’un patient.

Le système, appelé « RiskCardio », se concentre sur les patients qui ont survécu à un syndrome coronarien aigu (SCA), qui fait référence à une série de conditions où il y a une réduction ou un blocage du sang dans le cœur. En utilisant seulement les 15 premières minutes du signal brut de l’électrocardiogramme (ECG) d’un patient, l’outil produit un score qui place les patients dans différentes catégories de risque.

Les patients à risque élevé de RiskCardio – les patients du quartile supérieur – étaient presque sept fois plus susceptibles de mourir d’un décès d’origine cardiovasculaire que les patients du quartile inférieur, qui étaient à faible risque. Par comparaison, les patients identifiés comme présentant un risque élevé selon les paramètres de risque existants les plus courants n’étaient que trois fois plus susceptibles de subir un événement indésirable que leurs homologues à faible risque.

« Nous examinons le problème des données sur la façon dont nous pouvons incorporer de très longues séries chronologiques dans les scores de risque et le problème clinique sur la façon dont nous pouvons aider les médecins à identifier les patients à risque élevé après un événement coronarien aigu « , explique Divya Shanmugam, auteure principale d’un nouvel article sur RiskCardio. « L’intersection de l’apprentissage automatique et des soins de santé regorge de combinaisons comme celle-ci – un problème informatique convaincant avec un impact potentiel dans le monde réel. »

Une activité risquée

Les modèles antérieurs d’apprentissage automatique ont tenté de maîtriser le risque en utilisant soit des informations externes sur les patients comme l’âge ou le poids, soit des connaissances et une expertise propres au système – plus largement connues sous le nom de connaissances spécifiques au domaine – pour aider leur modèle à sélectionner différentes caractéristiques.

RiskCardio, cependant, utilise uniquement le signal ECG brut du patient, sans information supplémentaire.

Disons qu’un patient se présente à l’hôpital à la suite d’un SCA. Après l’admission, un médecin estimerait d’abord le risque de décès d’origine cardiovasculaire ou de crise cardiaque à l’aide de données médicales et de longs tests, puis il choisirait une série de traitements.

RiskCardio vise à améliorer cette première étape de l’estimation du risque. Pour ce faire, le système sépare le signal d’un patient en ensembles de battements consécutifs, avec l’idée que la variabilité entre les battements adjacents indique un risque en aval. Le système a été formé à l’aide des données d’une étude menée auprès d’anciens patients.

Pour que le modèle soit opérationnel, l’équipe a d’abord séparé le signal de chaque patient en une série de battements cardiaques adjacents. Ils ont ensuite attribué une étiquette – c.-à-d. si le patient est décédé ou non d’un décès d’origine cardiovasculaire – à chaque série de battements cardiaques adjacents. Les chercheurs ont formé le modèle pour classer chaque paire de battements cardiaques adjacents en fonction des résultats obtenus par le patient : Les battements cardiaques des patients décédés étaient étiquetés » risqués « , tandis que les battements cardiaques des patients survivants étaient étiquetés » normaux « .

Pour un nouveau patient, l’équipe a créé un score de risque en faisant la moyenne de la prédiction du patient à partir de chaque série de battements cardiaques adjacents.

Dans les 15 premières minutes d’un patient souffrant d’un SCA, il y avait suffisamment d’information pour estimer s’il allait ou non mourir d’une maladie cardiovasculaire dans les 30, 60, 90 ou 365 jours.

Néanmoins, calculer un score de risque à partir du seul signal ECG n’est pas une tâche facile. Les signaux sont très longs et plus le nombre d’entrées d’un modèle augmente, plus il devient difficile d’apprendre la relation entre ces entrées.

L’équipe a testé le modèle en produisant des scores de risque pour un ensemble de patients. Ensuite, ils ont mesuré dans quelle mesure un patient serait plus susceptible de souffrir d’une mort cardiovasculaire en tant que patient à haut risque qu’un ensemble de patients à faible risque. Ils ont découvert que chez environ 1 250 patients post-ACS, 28 mourraient d’une mort d’origine cardiovasculaire en moins d’un an. En utilisant la cote de risque proposée, 19 de ces 28 patients ont été classés à risque élevé.

À l’avenir, l’équipe espère rendre l’ensemble de données plus inclusif afin de tenir compte des différences d’âge, d’origine ethnique et de sexe. Ils prévoient également examiner des scénarios médicaux où il y a beaucoup de données mal étiquetées ou non étiquetées, et évaluer comment leur système traite et traite cette information pour tenir compte des cas plus ambigus.

L’apprentissage machine est particulièrement efficace pour identifier les schémas, ce qui est très pertinent pour évaluer le risque pour le patient « , dit Shanmugam. « Les scores de risque sont utiles pour communiquer l’état du patient, ce qui est précieux pour prendre des décisions de soins efficaces. »

Shanmugam a présenté l’article à la conférence Machine Learning for Healthcare aux côtés de Davis Blalock, étudiant au doctorat, et de John Guttag, professeur au MIT.