Santé

Séquençage long-read : mécanismes, promesses et applications en Santé

Publié le 30 septembre 2022 Lecture 25 min

En avril 2022, Oxford Nanopore annonçait les prochaines étapes de sa collaboration avec Genomics England, en charge du projet « 100 000 génomes » au Royaume-Uni. Leur objectif ? Compléter leur base de données en cancérologie afin d’identifier de façon rapide et précise des variants de cancer inconnus à ce jour en hémato-oncologie, sarcome et tumeurs cérébrales. Cette base de données aidera ensuite au diagnostic et au traitement de divers cancers. Cette collaboration est loin d’être un cas isolé, le séquençage long-read ouvrant de nouvelles possibilités dans le domaine de la santé. Aujourd’hui, notre équipe Santé vous présente cette technologie révolutionnaire : quels sont les mécanismes des 2 principales technologies sur le marché ? Quels sont leurs avantages ? Quels défis restent à relever ? Quelles applications prometteuses dans l’étude des cancers et des génomes viraux ?

Qu’est-ce que le séquençage long-read ?

Nous avons parcouru un long chemin depuis la première méthode de séquençage d’ADN, connue sous le nom de séquençage de Sanger, jusqu’au séquençage de nouvelle génération (NGS) aujourd’hui. Pourtant, nous continuons de rencontrer des problèmes dans l’assemblage du génome, en raison de la longueur actuelle de lecture des séquenceurs (de 75 à 400 pb). Le séquençage long-read (LRS) pourrait permettre de résoudre ces problèmes. Jetons un coup d’œil aux deux technologies qui dominent aujourd’hui ce marché.

Séquençage long-read SMRT par Pacific Biosciences

La première technologie de séquençage long-read à être introduite sur le marché fut la technologie SMRT (Single Molecule Real Time), déployée par Pacific Bioscience (PacBio) en 2011. Comment cette technologie fonctionne-t-elle ? Un ADN double brin est d’abord fragmenté en fonction de la taille souhaitée (cette technologie lit en moyenne 20 kpb et peut aller jusqu’à 100 kpb). Des adaptateurs sont ajoutés de chaque côté du fragment afin de former un cercle fermé. Une réaction de polymérase est ensuite réalisée dans l’obscurité sur ce fragment. Le laser éclairant le fragment d’ADN va générer des signaux à chaque fois que des nucléotides fluorescents présents dans la solution de séquençage seront ajoutés, permettant ainsi de déduire les bases qui viennent d’être ajoutées. [1]

Séquençage long-read ONT par Oxford Nanopore

La deuxième grande technologie de séquençage long-read introduite sur le marché fut celle d’Oxford Nanopore, en 2014. Dans ce cas-ci, une molécule d’ADN est sélectionnée et va passer à travers un nanopore. Tous les nucléotides ayant des motifs de résistance différents, des changements sont détectés dans la résistance lorsqu’ils traversent le pore. Ces changements permettent de déduire la séquence lue. Ici, la longueur des fragments d’ADN peut aller jusqu’à 800 kbp ! [1]

Avantages et défis du séquençage long-read

Ces deux technologies de séquençage long-read SMRT et ONT sont très prometteuses et pourraient nous aider à surmonter les problèmes de séquençage auxquels nous avons été confrontés jusqu’à présent. Cependant, quelques défis doivent encore être relevés avant que cette technologie ne puisse être pleinement déployée.

Avantages du séquençage long-read

Les « short reads » ne sont pas adaptées à la lecture de modifications étendues de séquence ou aux régions répétées. Avec le séquençage long-read, il est possible d’apporter plus de contexte aux longues séquences répétées, en ajoutant notamment ce qui se trouve avant et après la séquence d’intérêt. Ceci permettrait d’améliorer l’assemblage du génome et de détecter des variants qui n’ont pas été décelés avec le séquençage de nouvelle génération.

Le séquençage long-read pourrait également permettre de réduire considérablement le temps de séquençage. En effet, cette technologie nécessite peu, voir dans certains cas aucune amplification de la séquence d’intérêt. En effet, elle ne nécessite pas l’utilisation de la PCR avant l’étape de séquençage. Certaines technologies comme celle d’Oxford Nanopore n’ont même pas besoin d’un grand nombre de lectures de la même séquence pour obtenir des données complètes. Ainsi, des technologies telles que celles d’Oxford Nanopore peuvent fournir un flux de données presque immédiat, là où le séquençage de nouvelle génération peut parfois nécessiter une journée pour les séquences les plus longues.

Et les avantages de la technologie LRS ne s’arrêtent pas là : la réduction des coûts de séquençage et la portabilité des appareils la rendent d’autant plus prometteuse.

Principaux défis à relever pour le séquençage long-read

Certains diront que le séquençage long-read est encore loin des normes de précision instaurée par le séquençage de nouvelle génération (taux d’erreur inférieur à 1%). En effet, aujourd’hui le taux d’erreur moyen de cette technologie est d’environ 10%, excepté pour la technologie PacBio. Toutefois, la précision de cette technologie tend à s’améliorer rapidement, avec un taux d’erreur inférieur à 1% pour SMRT et 5% pour Oxford Nanopore [2]. Ainsi, même si toutes les technologies de séquençage long-read n’atteignent pas encore ces niveaux, le jour où les assemblages long-read dépasseront les assemblages short-reads pourrait arriver plus vite que prévu.

Ensuite, les technologies de séquençage long-read doivent être améliorées afin d’utiliser de plus petites quantités d’ADN. Ce point est particulièrement important pour le diagnostic du cancer. En effet, les échantillons cliniques pour le diagnostic moléculaire sont extrêmement limités. Ainsi, le développement de séquenceurs long-read fonctionnant avec de très petites quantités d’ADN sera essentiel. [3]

Enfin, même si les coûts de séquençage devraient baisser drastiquement dans les années à venir, le séquençage long-read reste aujourd’hui globalement plus cher que le séquençage de nouvelle génération. La préparation des échantillons et l’automatisation de certaines tâches sont des sources potentielles d’amélioration dans ce domaine, tout comme la taille des séquenceurs.

Applications du séquençage long-read dans le domaine des cancers et des génomes viraux

Grâce à ses avantages, la technologie de long-read a déjà largement contribué à la recherche dans le domaine de la santé, et plus particulièrement à l’analyse des cancers et des génomes viraux.

Analyse des cellules cancéreuses

Les séquenceurs long-read nous ont permis de mieux comprendre les Variants Structurels (VS), c’est-à-dire les combinaisons de mutations de l’ADN de plus de 50 pb. Les VS jouent un rôle fondamental dans le génome des cellules cancéreuses, en affectant la fonction de gènes importants tels que les oncogènes ou les gènes suppresseurs de tumeurs, comme ERBB2 dans le cancer du sein ou ROS1 dans le cancer du poumon. Il peut être difficile de détecter les VS et d’évaluer leur structure, car la longueur des reads utilisés par le séquençage de nouvelle génération ne dépasse parfois pas celle de ces mutations. Mais grâce au séquençage long-read, la recherche dans ce domaine s’est améliorée. Depuis 2016, nous avons pu mener des recherches sur pas moins de 17 VS impliqués dans le génome de cancers [3]. Certains de ces résultats sont déjà prometteurs. À titre d’exemple, une équipe de chercheurs s’est concentrée sur le cancer du sein et a identifié, grâce au séquençage long-read, des VS associés à un gène spécifique, ERBB2 [3], particulièrement actif dans ce cancer et lié à la résistance à des médicaments spécifiques.

Ces résultats devraient permettre de comprendre les différences entre patients, et surtout, ils devraient permettre de proposer de nouveaux traitements et outils de diagnostic plus efficaces. C’est pourquoi Genomics England a lancé l’initiative « Cancer 2.0 » et a décidé d’inclure la technologie de séquençage long-read ainsi que des données multimodales, afin d’obtenir de nouvelles données sur les moteurs d’évolution du cancer.


Découvrir les dernières avancées dans notre Centre d’Exploration en Oncologie >


Analyse des génomes viraux

Le séquençage complet des génomes viraux nous offre de nouvelles opportunités pour étudier la phylogénie et l’épidémiologie virales. En effet, les virus ont des génomes petits et compacts, allant de 2kb à 1mb, et sont plus enclins à muter que les autres organismes. Grâce à l’introduction du séquençage de nouvelle génération, nous avons pu faire des progrès incroyables dans l’analyse des génomes viraux et suivre leur évolution. Les technologies de séquençage long-read pourraient nous aider à aller plus loin.

Prenons l’exemple du SARS-CoV-2. Afin de suivre l’évolution de ce virus tout au long de la pandémie de Covid-19, les chercheurs ont principalement utilisé le séquençage de nouvelle génération. Comme souligné par un intervenant lors d’un webinar de PacBio, les assemblages réalisés avec cette technologie et présentés par le GISAID en 2021 présentaient de nombreuses données manquantes, jusqu’à 40% avec la technologie Illumina. Ces lacunes pouvaient atteindre jusqu’à 1 000 nucléotides dans certains cas [4]. Cela peut s’expliquer par la position des amorces lors du séquençage, le nombre de régions répétées ainsi que d’autres facteurs. La technologie PacBio a permis de mieux surmonter ces difficultés, en réduisant le nombre de lacunes à quelques-unes seulement [4]. Ainsi, le séquençage complet de ce virus avec la technologie de séquençage long-read nous a fourni davantage d’informations sur le SARS-CoV-2 et devrait nous aider à améliorer le suivi de son évolution, de sa stabilité et de son taux de mutation.

Le séquençage long-read permettra non seulement de suivre l’évolution du SARS-CoV-2, mais aussi de développer des thérapies pertinentes. En effet, nous pourrons suivre l’évolution de ce virus et analyser ses mécanismes d’action dans les organismes vivants. Nous devrions donc être en mesure d’anticiper une meilleure résistance aux médicaments par exemple. Cela pourrait conduire au développement de nouveaux traitements pour la pandémie de Covid-19.

La pandémie de Covid-19 ne sera pas la seule cible de la technologie de séquençage long-read. Elle pourrait très bien être appliquée à d’autres virus tels que la grippe ou le VIH. Cette nouvelle technologie de séquençage ouvre la voie au développement de nouveaux médicaments et de nouvelles thérapies.

Le séquençage long-read offre aujourd’hui de nouvelles possibilités dans le domaine des soins de santé et ouvre des perspectives passionnantes pour le développement de nouveaux outils de diagnostic et de traitements. Les promesses du séquençage long-read ne s’arrêtent pas à l’analyse du cancer et des génomes viraux, puisque cette technologie est utilisée dans un champ croissant d’applications dans les sciences de la vie. Même si la technologie doit encore être améliorée, chez Alcimed nous considérons que le séquençage long-read deviendra sans aucun doute essentiel dans les années à venir dans plusieurs domaines de recherche.

[1] Pollard, M. O., Gurdasani, D., Mentzer, A. J., Porter, T., & Sandhu, M. S. (2018). Long reads: their purpose and place. Human molecular genetics, 27(R2), R234–R241.

[2] Amarasinghe, S.L., Su, S., Dong, X. et al. Opportunities and challenges in long-read sequencing data analysis. Genome Biol 21, 30 (2020).

[3] Yoshitaka Sakamoto, Suzuko Zaha, Yutaka Suzuki, Masahide Seki, Ayako Suzuki, Application of long-read sequencing to the detection of structural variants in human cancer genomes. Computational and Structural Biotechnology Journal, Volume 19, 2021, Pages 4207-4216.

[4] Meredith Ashby, PacBio webinar. (2021, February 5th). Webinar: Opportunities for using PacBio Long-read sequencing for COVID-19 research. Youtube.


A propos de l’auteur,

Charlotte et Lucia Consultantes et Quentin, Responsable de Mission au sein de l’équipe Santé d’Alcimed en France

Vous avez un projet ?

    Parlez-nous de votre terre inconnue

    Vous avez un projet et vous souhaitez en parler avec un de nos explorateurs, écrivez-nous !

    Un de nos explorateurs vous recontactera très vite.


    Pour aller plus loin