Was ist Long-Read Sequenzierung?
Von der ersten DNA-Sequenzierungsmethode, der so genannten Sanger-Sequenzierung, bis zum Next Generation Sequencing (NGS) wurde ein langer Weg zurückgelegt. Dennoch tauchen bei der Genomassemblierung immer wieder Probleme auf, die auf die derzeitige Länge der Reads (zwischen 75 und 400 bp) zurückzuführen sind. Long-Read Sequencing (LRS) könnte diese Probleme lösen. Werfen wir einen Blick auf die beiden wichtigsten Technologien, die diesen Markt anführen.
SMRT-Long-Read Sequenzierung von Pacific Biosciences
Die erste LRS-Technologie, die auf dem Markt eingeführt wurde, war Single Molecule Real Time (SMRT), die 2011 von Pacific Bioscience (PacBio) eingeführt wurde. Wie funktioniert sie? Eine doppelsträngige DNA wird zunächst entsprechend der gewünschten Größe fragmentiert. Diese Sequenzierungstechnologie liest im Durchschnitt 20 kbp und kann bis zu 100 kbp erreichen. Auf jeder Seite werden Adaptoren hinzugefügt, um einen geschlossenen Kreis zu bilden. Anschließend wird im Dunkeln eine Polymerase-Reaktion mit dem Fragment durchgeführt. Der Laser, der das DNA-Fragment beleuchtet, erzeugt jedes Mal, wenn fluoreszierende Nukleotide in der Sequenzierlösung hinzugefügt werden, Signale, die Rückschlüsse auf die gerade hinzugefügten Basen zulassen.
ONT Long-Read Sequenzierung von Oxford Nanopore Technologies
Die zweite wichtige Sequenzierungstechnologie, die 2014 auf den Markt kam, ist die von Oxford Nanopore. In diesem Fall wird ein DNA-Molekül ausgewählt und durch eine Nanopore geleitet. Entscheidend ist dabei, dass alle Nukleotide unterschiedliche Resistenzmuster aufweisen. Beim Durchgang durch die Pore werden Veränderungen im Widerstand festgestellt. Anhand dieser Veränderungen kann auf die Sequenz geschlossen werden. Dabei kann die Länge der DNA-Fragmente bis zu 800 kbp betragen!
Vorteile und Herausforderungen der Long-Read Sequenzierung
Diese beiden Sequenzierungstechnologien sind recht vielversprechend und könnten dabei helfen, die Probleme zu überwinden, die bisher bei der DNA-Sequenzierung auftraten. Dennoch müssen noch einige Herausforderungen bewältigt werden, bevor diese Technologie vollständig eingesetzt werden kann.
Vorteile der Long-Read Sequenzierung
Kurze Reads sind nicht für große Veränderungen der Sequenzen oder sich wiederholende Abschnitte geeignet. Mit LRS kann langen, sich wiederholenden Sequenzen mehr Kontext gegeben werden, indem hinzufügt wird, was vor und nach der betreffenden Sequenz liegt. Dies wird dazu beitragen, die Genomzusammensetzung zu verbessern und Varianten zu entdecken, die bei der Short-Read Sequenzierung übersehen wurden.
Die LRS könnte auch den Zeitaufwand für die Sequenzierung erheblich verringern. Mit LRS ist eine Amplifikation nicht oder nur in geringem Umfang erforderlich. Es ist keine PCR vor dem Sequenzierungsschritt erforderlich. Einige Sequenzierungstechnologien wie Oxford Nanopore benötigen nicht einmal viele Reads der gleichen Sequenz, um vollständige Daten zu erhalten. Daher können Technologien wie Oxford Nanopore fast sofortige Datenströme liefern, während NGS manchmal einen Tag für die längsten Sequenzen benötigen kann.
Und die Vorteile der LRS gehen noch weiter: Die Reduzierung der Sequenzierungskosten und die Handlichkeit der Geräte machen sie noch vielversprechender.
Die wichtigsten Herausforderungen bei der Long-Read Sequenzierung
Einige mögen argumentieren, dass LRS nicht den Genauigkeitsstandards von NGS (Fehlerrate <1 %) entsprechen kann. In der Tat liegt die durchschnittliche Fehlerrate bei LRS heute bei etwa 10 %, mit Ausnahme der PacBio-Technologie. Dennoch verbessert sich die Genauigkeit dieser Sequenzierungstechnologien mit hoher Geschwindigkeit, wobei die Fehlerrate bei SMRT auf <1 % und bei Oxford Nanopore auf < 5% sinkt. Auch wenn noch nicht alle LRS-Technologiearten dieses Niveau erreichen, könnte der Tag, an dem die LRS-Assemblierungen die NGS-Assemblierungen übertreffen, schneller kommen als erwartet.
Zweitens müssen die LRS-Technologien verbessert werden, damit kleinere DNA-Mengen verwendet werden können. Diese Herausforderung ist vor allem bei der Krebsdiagnose von entscheidender Bedeutung. Die klinischen Proben für die Molekulardiagnostik sind nämlich sehr begrenzt. Daher ist die Entwicklung von Sequenzierern, die mit sehr kleinen DNA-Mengen arbeiten, von entscheidender Bedeutung.
Auch wenn die Sequenzierungskosten in den kommenden Jahren drastisch sinken dürften, ist die Long-Read Sequenzierung immer noch teurer als NGS. Neben der Größe der Sequenzierer bieten die Probenvorbereitung und die Automatisierung potenzielle Verbesserungsmöglichkeiten in diesem Bereich.
Anwendungen der Long-Read Sequenzierung bei Krebs und viralen Genomen
Dank ihrer Vorteile hat die LRS bereits einen wichtigen Beitrag zur Forschung im Gesundheitswesen und insbesondere zur Analyse von Krebs- und Virusgenomen geleistet.
Analyse von Krebsgenomen
LRS-Sequenzierer haben dabei geholfen, Strukturvarianten (SVs), d. h. Kombinationen von DNA-Mutationen, die länger als 50 bp sind, besser zu verstehen. Strukturvarianten spielen in Krebsgenomen eine fundamentale Rolle, da sie die Funktion wichtiger Gene wie Onkogene oder Tumorsuppressorgene beeinträchtigen, z. B. ERBB2 bei Brustkrebs oder ROS1 bei Lungenkrebs. Es kann schwierig sein, SVs aufzuspüren und ihre Struktur zu ermitteln, da die Länge der kurzen Reads, die bei NGS verwendet werden, manchmal nicht die Länge dieser Mutationen übersteigt. Aber dank LRS hat sich die Forschung auf diesem Gebiet verbessert. Seit 2016 konnten nicht weniger als 17 SVs erforscht werden, die in Krebsgenomen vorkommen. Einige der Ergebnisse sind bereits vielversprechend. So hat sich ein Forscherteam auf Brustkrebs konzentriert und dank LRS SVs identifiziert, die mit einem bestimmten Gen in Verbindung stehen, das bei Brustkrebs besonders aktiv ist und gegen bestimmte Medikamente resistent macht: ERBB2.
Diese Ergebnisse sollten helfen, die Unterschiede zwischen den Patienten zu verstehen, und, was noch wichtiger ist, sie sollten es ermöglichen, neue und wirksamere Behandlungen und Diagnoseinstrumente für Krebs anzubieten. Aus diesem Grund hat Genomics England die Initiative „Cancer 2.0“ ins Leben gerufen und beschlossen, die Long-Read Sequenzierungstechnologie und multimodale Daten einzubeziehen, um Erkenntnisse über Krebsauslöser und die Entwicklung von Krebserkrankungen zu gewinnen.
Erfahren Sie mehr über die jüngsten Fortschritte in der Forschung in unserem Oncology Exploration Center >
Analyse viraler Genome
Die vollständige Sequenzierung viraler Genome eröffnet neue Möglichkeiten zur Untersuchung der Phylogenie und Epidemiologie von Viren. Viren haben nämlich kleine und kompakte Genome, die zwischen 2 kb und 1 mb groß sind, und sind anfälliger für Mutationen als andere Organismen. Dank der Einführung von NGS konnten unglaubliche Fortschritte bei der Analyse viraler Genome gemacht und ihre Entwicklung verfolgt werden. Long-Read Sequenzierungstechnologien könnten dabei helfen, noch weiter zu gehen.
Nehmen wir das Beispiel von SARS-CoV-2. Um die Entwicklung dieses Virus während der jüngsten Pandemie zu verfolgen, haben Forscher hauptsächlich Short-Read Sequenzierung eingesetzt. Wie in einem Webinar von PacBio hervorgehoben wurde, wiesen die von GISAID im Jahr 2021 vorgelegten Assemblierungen viele Lücken auf – bis zu 40 % mit der Illumina-Technologie. Diese Lücken konnten in einigen Fällen bis zu 1.000 Nukleotide betragen. Dies lässt sich durch die Position der Primer bei der Sequenzierung, die Anzahl der sich wiederholenden Abschnitte und andere Faktoren erklären. Mit der PacBio-Technologie konnten diese Herausforderungen besser gemeistert und die Lücken auf wenige reduziert werden. Die vollständige Sequenzierung dieses Virus mit der LRS erlaubt es also, mehr über SARS-CoV-2 zu erfahren. Dies wird dabei helfen, die Entwicklung, Stabilität und Mutationsrate des Virus besser zu überwachen.
Die Long-Read Sequenzierung wird nicht nur dazu beitragen, die Entwicklung von SARS-CoV-2 zu verfolgen, sondern auch relevante Therapeutika zu entwickeln. Die Entwicklung dieses Virus kann so verfolgt und seine Mechanismen in lebenden Organismen analysiert werden. Auf diese Weise kann zum Beispiel eine stärkere Medikamentenresistenz frühzeitig identifiziert werden. Dies könnte zur Entwicklung neuer Therapeutika gegen die COVID-19-Pandemie führen.
Die COVID-19-Pandemie wird nicht das einzige Anwendungsgebiet der LRS sein. Sie könnte sehr wohl auch auf andere Viren wie Influenza oder HIV angewendet werden. LRS ebnet den Weg für die Entwicklung neuer Arzneimittel und Therapeutika.
Long-Read Sequencing bietet heute neue Möglichkeiten im Gesundheitswesen und eröffnet spannende Chancen für die Entwicklung neuer Diagnoseinstrumente und Therapien. Die Versprechungen der LRS beschränken sich nicht auf die Analyse von Krebs- und Virusgenomen, da diese Sequenzierungstechnologie in einem wachsenden Anwendungsbereich der Biowissenschaften eingesetzt wird. Auch wenn sie noch verbessert werden muss, ist Alcimed überzeugt, dass LRS in den kommenden Jahren in verschiedenen Forschungsbereichen unentbehrlich werden wird. Wenn Sie mehr über die Entwicklungen in der Gentechnik erfahren möchten, zögern Sie nicht, unser Team zu kontaktieren!
Über die Autoren,
Charlotte und Lucia, Consultants, und Quentin, Project Manager in Alcimeds Life Sciences Team in der Schweiz