Le génome du VIH se plie en quatre pour aider le virus à s’emparer des cellules
Le virus HIV-1 a un minuscule génome. Ses neuf gènes tiennent tous sur une seule molécule d’ARN, et la bibliothèque complète du matériel génétique de l’organisme ne compte que 10 kilobases (pour situer le contexte, le génome humain est d’environ 3 millions de kilobases). Mais malgré le petit nombre de gènes du virus, il est capable d’utiliser une méthode appelée épissage alternatif pour produire de nombreuses protéines diverses à des fins différentes. Les transcriptions d’ARN de ces protéines sont comme des mots individuels cachés dans un mur de texte, explique Silvi Rouskin, membre de l’Institut Whitehead : « Vous les coupez et les collez (par épissage alternatif), et quand vous les mettez tous ensemble, vous obtenez une phrase qui a du sens. »
Comme aucun des gènes du VIH ne code la machinerie cellulaire nécessaire pour « couper et coller » l’ARN – il détourne pour cela les matériaux de son hôte – les scientifiques continuent de déterminer exactement comment chaque molécule du VIH est capable de contrôler l’endroit où elle est épissée. Rouskin et d’autres ont émis l’hypothèse que la conformation, ou la forme, des molécules d’ARN pourrait avoir quelque chose à voir avec ce processus. Les séquences d’ARN dans le virus – même celles qui ont exactement la même séquence de nucléotides – pourraient se courber et se tordre de différentes manières, ce qui entraînerait des différences dans la façon dont elles sont coupées plus tard pour créer des transcrits pour les protéines. Or, dans une étude publiée le 6 mai dans la revue La nature, Rouskin et ses coauteurs suggèrent que cette hypothèse est correcte – et introduisent un nouvel algorithme qui peut efficacement identifier et trier les molécules d’ARN selon leur forme.
Pour commencer ses recherches sur les structures de l’ARN du VIH-1, Mme Rouskin s’est tournée vers une méthode qu’elle a mise au point au cours de ses dernières années à Whitehead. Cette méthode, appelée DMS-MaPseq, consiste à marquer les molécules d’ARN avec de minuscules groupes méthyle. Les groupes méthyle se lient à des bases non appariées le long du brin d’ARN, qui se produisent soit sur de longues lignes droites d’ARN exposé, soit en boucles qui se forment lorsque des sections complémentaires se lient les unes aux autres. Ces groupes méthyles peuvent être détectés car ils entraînent des mutations lorsque l’ARN est transcrit en ADN. M. Rouskin a introduit cette technique pour la première fois en 2017 dans un article paru dans Méthodes de la nature.
Dans son nouvel article, Mme Rouskin a utilisé le DMS MaPseq pour marquer les molécules du VIH-1 avec ces mutations. Ensuite, elle a conçu, avec des collaborateurs de l’Institut de recherche médicale Walter et Eliza Hall et d’ailleurs, un algorithme qui utilise les données de séquençage sur les lieux où les mutations se sont produites pour révéler les différentes façons dont le même modèle d’ARN peut être façonné. Par exemple, si une base est mutée seulement à la moitié de la fréquence prévue, il y a au moins deux formes que la séquence d’ARN peut prendre – une conformation dans laquelle la base est exposée dans une boucle ou un étirement ouvert, et une autre où elle est solidement liée à une région complémentaire sur la séquence d’ARN.
Alors que les anciennes méthodes de détermination de la structure de l’ARN supposaient que chaque molécule d’ARN était fondamentalement identique, le nouvel algorithme de Rouskin prend en compte la possibilité qu’il puisse y avoir de nombreuses conformations différentes – et trie ensuite ses résultats en fonction de leur forme et des fréquences relatives de chacune. Cela permet aux chercheurs non seulement d’observer la fréquence des formes connues, mais aussi de découvrir de nouvelles conformations. Un autre avantage de l’algorithme, selon M. Rouskin, est que contrairement aux méthodes thermodynamiques, qui utilisent des modèles mathématiques pour calculer les structures possibles des molécules d’ARN, cet algorithme peut être utilisé pour analyser comment elles apparaissent réellement dans les cellules vivantes.
Pour valider l’algorithme, Mme Rouskin et ses collaborateurs ont créé leurs propres transcriptions d’ARN à partir d’un gène humain afin de les utiliser comme modèle de test. Ils ont choisi une séquence qui suppose naturellement deux conformations différentes connues. Ils ont ensuite mélangé les deux structures et utilisé le DMS MaPseq pour les marquer avec des groupes méthyles et induire des mutations. Lorsqu’ils ont appliqué le nouvel algorithme aux données de séquençage, ils ont pu identifier correctement les deux structures jusqu’à ce que la concentration de l’une d’entre elles tombe en dessous de 6 % du mélange.
Ensuite, ils sont retournés sur le génome du VIH pour voir si la méthode pouvait être utilisée à la fois in vitro et sur des virus vivants comme ils ont infecté des cellules humaines. Ils se sont d’abord concentrés sur une partie spécifique de la séquence d’ARN du VIH-1, dont des études antérieures ont montré qu’elle formait des structures comportant quatre ou cinq tiges ramifiées. Lorsqu’ils ont testé l’algorithme sur un mélange des deux conformations, ils ont pu évaluer avec précision la prévalence relative de chacune d’entre elles. Une autre expérience sur le virus VIH-1 infectant les cellules T humaines a révélé que l’algorithme pouvait également évaluer la prévalence des structures in vivo.
Ensuite, ils ont cherché à savoir comment les différentes structures pouvaient affecter l’épissage de l’ARN en examinant un site d’épissage spécifique. Si le brin d’ARN était coupé à cet endroit, il pourrait coder pour une protéine appelée tat. Sinon, aucune de ces protéines ne pourrait être fabriquée. L’algorithme a identifié deux conformations présentes dans les cellules infectées par le VIH-1 : une conformation a laissé le site d’épissage exposé pour que les machines de coupe de la cellule hôte coupent le brin ; l’autre l’a caché dans la molécule pour que les molécules d’épissage ne puissent pas se lier. Lorsqu’ils ont testé si les mutations de l’ARN qui rendaient cette dernière structure plus répandue, ils ont observé une diminution de la quantité de transcription tat que le virus pouvait produire. « Cacher ou exposer ces signaux est un moyen pour le virus de prendre le contrôle de son épissage », explique M. Rouskin.
Le virus peut également utiliser des conformations alternatives pour s’assurer que certaines molécules d’ARN restent complètement non épissurées à tout moment – ce qui garantit qu’il y aura suffisamment de copies complètes du génome viral à transmettre lorsque le virus se répliquera. Cette hypothèse sera vérifiable lorsque la technologie de séquençage permettra aux chercheurs d’analyser la structure de l’ensemble des molécules d’ARN du VIH-1 en une seule fois (pour l’instant, ils doivent briser la séquence en plus petits morceaux). Si une molécule d’ARN peut être observée cachant tous ses sites d’épissage en même temps, « ce serait le tueur », dit M. Rouskin. « Il nous manque cette donnée. »
L’hypothèse semble cependant probable, compte tenu des résultats de l’équipe sur l’hétérogénéité du génome du VIH-1 dans son ensemble : lorsqu’ils ont utilisé leur algorithme pour tester les structures formées par l’ARN du VIH, ils ont constaté que l’ARN du VIH était extrêmement variable, avec au moins deux structures alternatives pour plus de 90 pour cent des sections d’ARN que l’équipe a analysées.
Pouvoir trier les molécules d’ARN selon leur conformation a également des applications pour la structure de l’ARN humain, explique M. Rouskin. « Ce que nous faisons en ce moment, c’est tirer les leçons des virus et nous demander si l’ARN humain fait la même chose ». dit M. Rouskin. « Les gens ont appris beaucoup de choses des virus et réalisent ensuite que la cellule humaine fait la même chose. Nous sommes très enthousiastes. Et nos résultats préliminaires suggèrent qu’en fait, oui, c’est aussi un mécanisme que les ARN humains utilisent aussi, pour réguler leur épissage alternatif. »
En savoir plus sur ce mécanisme pourrait un jour être utile dans un cadre clinique, déclare Phil Tomezsko, étudiant diplômé du programme de virologie de Harvard, qui étudie dans le laboratoire de Rouskin, et co-premier auteur de l’article. « Il existe des maladies génétiques rares qui peuvent être traitées ou potentiellement guéries en modifiant les schémas d’épissage de différents gènes », dit-il. « Plus largement, il y a très probablement beaucoup de décisions d’épissage alternatives qui se produisent dans les maladies complexes – et si nous savons que la structure alternative de l’ARN est une façon de réguler l’épissage humain, cela pourrait ouvrir beaucoup de perspectives sur différentes maladies que nous ne comprenons pas encore vraiment ».
L’algorithme DREEM est également utilisé pour étudier le nouveau coronavirus, explique M. Tomezsko. « En appliquant cette technique pour étudier la structure de l’ARN dans le cycle de réplication du SRAS-CoV-2, nous espérons trouver de nouvelles étapes de régulation qui pourraient être ciblées par les antiviraux », dit-il.
Les travaux de M. Rouskin sur les ARN du VIH-1 sont soutenus, en partie, par les National Institutes of Health, le Center of HIV-1 RNA Studies, la Smith Family Foundation et le Burroughs Wellcome fund.