DeepMind stellt AlphaGenome vor: KI zur Entschlüsselung des Lebens wird zu einem Schlüsselwerkzeug werden
Am 26. Juni wurde bekannt gegeben, dass DeepMind, ein Institut für Künstliche Intelligenz im Alphabet-Konzern, die Genomik in eine neue Ära führen will. Mit dem neuen KI-Modell AlphaGenome versucht DeepMind, eine Frage zu beantworten, die Biologen seit Jahrzehnten beschäftigt: Welcher Teil der menschlichen DNA spielt eine Schlüsselrolle bei der Entstehung von Krankheiten und wie genau funktioniert das?
Vor fünf Jahren hat Google AlphaFold vorgestellt, ein KI-Modell zur Vorhersage der dreidimensionalen Struktur von Proteinen. Diese Technologie hat wegen ihres bahnbrechenden Beitrags in der Biologie im vergangenen Jahr den Nobelpreis erhalten und hat die Gründung der Tochterfirma Isomorphic Labs zur Medikamentenentwicklung angeregt. Gleichzeitig hat es auch einen Boom bei KI-gestützten Medizintechnologie-Startups ausgelöst. Jetzt versucht AlphaGenome, eine andere, noch grundlegendere aber ebenso wichtige Frage zu beantworten: Was passiert, wenn sich ein einzelnes Zeichen in der DNA ändert? Wie wirkt sich das auf die Genexpression aus? Hängt das mit Gesundheit oder Krankheit zusammen?
Im Gegensatz zu traditionellen Modellen, die sich auf kurze Sequenzen oder einzelne Aufgaben konzentrieren, kann AlphaGenome DNA-Fragmente mit bis zu einer Million Basenpaaren verarbeiten und in Echtzeit verschiedene biologische Eigenschaften im Zusammenhang mit der Genregulation vorhersagen – darunter die Startposition von Genen, die Art der Spleißung, die Menge der exprimierten RNA und sogar die Wahrscheinlichkeit der Proteinbindung.
Dieses Modell konzentriert sich nicht nur auf die bekannten, nur 2 % des Genoms ausmachenden proteinkodierenden Bereiche. Erstmals geht es auch in die "Dunkle Materie" des Genoms vor – die riesigen, aber lange vernachlässigten nicht-kodierenden regulatorischen Bereiche. Diese Bereiche werden als Schlüssel für die Regulation festgelegt, wann und wo Gene an- oder ausgeschaltet werden. Genau an diesen Stellen verstecken sich oft Mutationen, die eng mit Krebs, seltenen Krankheiten und sogar neurologischen Erkrankungen zusammenhängen. In Zukunft können Krankheiten wie Krebs oder Alzheimer früher erkannt, besser verstanden und personalisierter behandelt werden.
Ein Modell für umfassende Vorhersagen
DeepMind hat erklärt, dass AlphaGenome derzeit das erste KI-System ist, das in einer einzigen Architektur die Fähigkeit zur Vorhersage mit langer Kontextverarbeitung und Einzelbasenauflösung integriert. Durch die Einführung einer Architektur, die Convolutional Networks und Transformer kombiniert, erreicht dieses Modell eine bisher nie dagewesene Genauigkeit und Breite – es macht nicht nur genaue Vorhersagen, sondern deckt auch einen breiteren Bereich ab.
In der praktischen Anwendung können Forscher dem Modell eine DNA-Sequenz übermitteln und schnell eine Bewertung der regulatorischen Aktivität dieser Sequenz in verschiedenen Geweben und Zellen erhalten. Diese Geschwindigkeit und Effizienz sind von direktem Nutzen für die Forschung in Bereichen wie seltenen Krankheiten und Krebs.
In einer Fallstudie hat AlphaGenome erfolgreich vorhergesagt, dass eine nicht-kodierende Mutation im Genom eines Leukämiepatienten möglicherweise dazu führt, dass das Krebsgen TAL1 abnormal aktiviert wird. Der Mechanismus besteht darin, dass eine neue MYB-Bindungsstelle eingeführt wird. Diese Vorhersage stimmt gut mit den bekannten Krankheitsmechanismen überein und zeigt das Potenzial von AlphaGenome bei der Aufdeckung der kausalen Beziehung zwischen Variationen und Krankheiten.
Sprung in Effizienz und Leistung
Nach Angaben von DeepMind hat AlphaGenome in 22 von 24 Standardtests im Bereich der Genomvorhersage bessere Ergebnisse erzielt als die bisher besten Modelle. Bei der Vorhersage von Mutationsauswirkungen hat es in 24 von 26 Fällen die speziellen Modelle erreicht oder übertroffen.
Bemerkenswerterweise ist AlphaGenome das einzige Modell, das über Aufgaben und Modalitäten hinweg gemeinsame Vorhersagen treffen kann. Früher mussten Forscher oft mehrere Modelle nutzen, um diese Aufgaben zu erfüllen. Jetzt können sie mit einem einzigen API-Aufruf alle Vorhersageergebnisse erhalten, was die Forschungseffizienz erheblich steigert.
Noch wichtiger ist, dass AlphaGenome die Trainingskosten drastisch senkt, ohne die Leistung zu beeinträchtigen – die Trainingszeit beträgt nur 4 Stunden, und es benötigt nur die Hälfte der Rechenressourcen des Vorgängermodells Enformer.
Schritt in Richtung personalisierte Medizin
Obwohl die aktuelle Version nur für nicht-kommerzielle Forschungszwecke bestimmt ist und noch nicht für die individuelle Gendiagnose eingesetzt wird, ist ihre potenzielle Bedeutung unverkennbar. Die Vorhersagefähigkeit von AlphaGenome wird es Wissenschaftlern ermöglichen, Schlüsselvariationen schneller zu identifizieren und die Fähigkeit zur Früherkennung und zielgerichteten Behandlung von komplexen Krankheiten zu verbessern. "Diese Arbeit legt die Grundlage für die prädiktive Medizin", sagt Marc Mansour, Professor für Krebsgenetik an der University College London. "Endlich haben wir ein Werkzeug, mit dem wir die Auswirkungen von nicht-kodierenden Variationen in großem Maßstab bewerten können. Dies ist der Schlüssel zur Entschlüsselung der Mechanismen komplexer Krankheiten."
DeepMind gibt auch zu, dass AlphaGenome nicht allmächtig ist. Das Modell hat derzeit Schwierigkeiten, Fernregulationssignale, die mehr als 100.000 Basenpaare vom Zielgen entfernt sind, zu erfassen. Darüber hinaus wird die Erfassung der Unterschiede zwischen verschiedenen Zell- und Gewebetypen noch optimiert. Wichtig ist auch, dass es keine medizinische Diagnose ersetzen kann – komplexe Merkmale und Krankheiten hängen oft von Entwicklungs-, physiologischen und Umwelteinflüssen ab, die derzeit nicht in das Modell von AlphaGenome einbezogen sind.
Für die Forschungsgemeinschaft bietet AlphaGenome jedoch ein einheitliches, starkes und erweiterbares Werkzeuggerüst. Mit der Hinzunahme von mehr Daten kann es möglicherweise auf andere Arten erweitert werden und in Zukunft sogar klinische Anwendungen unterstützen.
Dieser Artikel stammt von "Tencent Technology", Autor: Wuji. Veröffentlicht von 36Kr mit Genehmigung.