AI-gesteuerte De-novo-Entwicklung von kleinen, an Proteine bindenden Molekülen: Südkoreanisches Team entdeckt Proteine zur selektiven Erkennung von Stresshormonen

Die Verwendung von KI zur Neukonstruktion von Proteinen, die bestimmte Verbindungen erkennen können

Ein Forschungs-Team der Fakultät für Biowissenschaften am Korea Advanced Institute of Science and Technology (KAIST) hat mithilfe von Deep Learning-getriebenen Methoden zur Proteinstrukturgenerierung und Sequenzdesign de novo diverse kleine Molekül-bindende Proteine entwickelt, wobei die NTF2-ähnliche Faltung (NTF2-like fold) als zentrales „allgemeines Rückgrat“ diente. Anschließend wurden diese Proteine in Sensoren ähnlich der chemisch induzierten Dimerisierung (CID) umgewandelt. Die Forscher haben erfolgreich ein Protein entworfen, das das Stresshormon Cortisol selektiv erkennt, und auf dieser Grundlage einen künstlichen Intelligenz-Biosensor entwickelt.

Im Bereich der Lebenswissenschaften und Synthetischen Biologie ist die Entwicklung von kleinen Molekül-bindenden Proteinen mit hoher Affinität und Spezifität eine Schlüsselherausforderung für die Realisierung von Biosensoren und molekularen Schaltern. In der Vergangenheit war diese Richtung hauptsächlich auf die Selektion und Modifikation natürlicher Proteine oder auf physikalische Modellierungen basierend auf bestehenden Proteinrückgraten angewiesen, was die Allgemeingültigkeit und Skalierbarkeit stets einschränkte.

Angesichts dieser Herausforderung hat das Forschungs-Team der Fakultät für Biowissenschaften am KAIST mithilfe von Deep Learning-getriebenen Methoden zur Proteinstrukturgenerierung und Sequenzdesign de novo diverse kleine Molekül-bindende Proteine entwickelt, wobei die NTF2-ähnliche Faltung (NTF2-like fold) als zentrales „allgemeines Rückgrat“ diente und diese anschließend in Sensoren ähnlich der chemisch induzierten Dimerisierung (CID) umgewandelt. Die Forscher haben erfolgreich ein Protein entworfen, das das Stresshormon Cortisol selektiv erkennt, und auf dieser Grundlage einen künstlichen Intelligenz-Biosensor entwickelt. Dieser Fall geht über die reine Proteindesignphase hinaus und tritt in den Bereich der praktisch messbaren Sensortechnologie, wodurch das seit langem bestehende Problem der Erkennung kleiner Moleküle im Proteindesign gelöst wird.

Die zugehörigen Forschungsresultate sind unter dem Titel „Small-molecule binding and sensing with a designed protein family“ in Nature Communications veröffentlicht worden.

Highlights der Studie:

* Verwendung von künstlicher Intelligenz für die de novo-Entwicklung von Proteinen zur Erkennung bestimmter Verbindungen und deren Anwendung in funktionalen Biosensoren

* Traditionelle Methoden beinhalten hauptsächlich die Suche nach natürlichen Proteinen oder die Modifikation ihrer Funktionen, während diese Studie durch künstliche Intelligenz-basiertes Design „maßgeschneiderte“ Proteine mit den gewünschten Funktionen entwickelt hat

* Die Forschungsergebnisse können in verschiedenen Bereichen wie Krankheitsdiagnose, Entwicklung neuer Medikamente und Umweltüberwachung eingesetzt werden

Link zur Studie:https://www.nature.com/articles/s41467-026-70953-8

Datensatz: Aufbau des NTF2-Rückgrats

Um das Entwurfsziel zu erreichen, haben die Forscher zunächst eine Reihe von NTF2-Strukturen (Sammlung 1: 1.615 Rückgrate) mithilfe der familienweiten „Halluzinations“-Methode erzeugt, anschließend die Sequenzen dieser Rückgrate mit ProteinMPNN neu entworfen und durch AlphaFold Proteine selektiert, die in die entworfene Struktur falten können (Sammlung 2: 3.230 Rückgrate). Darüber hinaus haben sie auch mithilfe von Rosetta-Parametern Rückgratstrukturen generiert, ebenfalls die Sequenz mit ProteinMPNN entworfen und die Struktur mit AlphaFold validiert (Sammlung 3: 6.838 Rückgrate), wie in der folgenden Abbildung gezeigt:

Generierung des NTF2-Rückgrats

Schließlich haben die Forscher nach der Selektion auch codierende Oligonukleotide für die experimentelle Charakterisierung erhalten, darunter: 630 HCY-bindende Proteine, 1.661 ROC-bindende Proteine, 16.276 WRF-bindende Proteine, 9.024 APX-bindende Proteine, 19.390 IRI-bindende Proteine und 7.573 OHP-bindende Proteine.

Entwicklung einer Familie von NTF2-Proteinen mit diversen Taschengeometrien

Die NTF2-Faltung besteht aus drei α-Helices und einem gewölbten sechsträngigen β-Faltblatt, die zusammen eine große innere Bindetasche bilden, die für diese Faltungsfamilie charakteristisch ist, wie in der folgenden Abbildung gezeigt:

Die NTF2-Faltung hat einen gestaltbaren Strukturrahmen

Die Diversität dieser Faltung in der Natur stammt hauptsächlich von langen und unregelmäßigen Schleifenbereichen sowie der einzigartigen Quartärstruktur, die beide die Geometrie und Funktion der Bindetasche beeinflussen. Das Ziel dieser Studie war es, eine Familie von NTF2-Proteinen mit diversen Taschengeometrien zu entwickeln, um eine breite Palette von kleinen Molekülen aufzunehmen, während die Schleifenbereiche minimiert werden, um die modularen Eigenschaften und Gestaltbarkeit zu erhalten, wie der gesamte Entwurfsprozess in der folgenden Abbildung gezeigt wird:

Schematischer Ablauf des Designs von kleinen Molekül-bindenden Proteinen basierend auf der NTF2-Faltung

Nachdem die Forscher über 10.000 NTF2-Entwurfsproteine mit verschiedenen Taschengeometrien erhalten hatten, haben sie mit RIFdock sechs chemisch und strukturell unterschiedliche kleine Moleküle in die zentralen Taschen dieser Rückgrate platziert. Zu diesen kleinen Molekülen gehören das Stresshormon Cortisol (HCY), das Antikoagulanzium Warfarin (WRF), das Muskelrelaxanzium Rocuroniumbromid (ROC), das Antikoagulanzium Apixaban (APX), das aus dem Krebsmedikament Irinotecan stammende antitumoral aktive Molekül SN-38 (IRI) und das Hormon 17-α-Hydroxyprogesteron (OHP).

Im Proteindesign ist die Erstellung polarer Grenzflächen eine wichtige Herausforderung, insbesondere für kleine Molekül-bindende Proteine. Hierbei müssen polare Reste in die innere Tasche eingeführt werden, um mit den polaren funktionellen Gruppen des Liganden zu interagieren, ohne die Gesamtstabilität des Proteins zu beeinträchtigen. Dafür haben die Forscher zwei Strategien eingesetzt:

Methode 1 (RIFdock to HBNets)

Die Forscher haben HCY, WRF, ROC, APX und IRI in die Rückgrate der Sammlung 1 dockt und gefordert, dass mindestens eine Protein-Kleines-Molekül-Interaktion durch HBNet-Reste vermittelt wird. Anschließend wurde die Optimierung mithilfe eines von natürlichen Sequenzen geleiteten Rosetta-Designs durchgeführt, wobei die Sequenzierung durch eine positionspezifische Bewertungsmatrix aus NTF2-Familienproteinen vorgespannt wurde.

Methode 2 (unrestricted RIFdock)

Mit der unbeschränkten RIFdock-Methode wurden OHP, APX und IRI in die Rückgrate der Sammlung 2 und 3 platziert, und die Sequenzierung wurde mit LigandMPNN durchgeführt. LigandMPNN ist eine Variante von ProteinMPNN, die speziell auf Protein-Kleines-Molekül-Komplexdaten trainiert wurde und die Anwesenheit des Liganden bei der Entwurfszeit explizit berücksichtigen kann.

Beim Filtern der Entwurfsergebnisse haben die Forscher mit Rosetta die Anzahl der Wasserstoffbrückenbindungen, die Bindungsenergie (ddG) und die kontaktierende Moleküloberfläche (CMS) zwischen Protein und Ligand berechnet. Bei Methode 2 wurde auch das Vorhersageergebnis von AlphaFold für einzelne Sequenzen verwendet, um Entwürfe auszuwählen, die sowohl die Zielstruktur als auch die Bindungsstelle wiedergeben können (siehe folgende Abbildung).

Entwurfsbewertungsindikatoren

Ergebnispräsentation: NTF2-basierte kleine Molekül-bindende Proteine können in Biosensoren eingesetzt werden

Die Forscher haben eine Reihe von Experimenten durchgeführt, um die Wirksamkeit der in dieser Studie vorgeschlagenen Entwurfstrategie zu überprüfen:

Strukturcharakterisierung der entworfenen Bindeproteine

Um die Genauigkeit der entworfenen kleinen Molekül-bindenden Proteine zu überprüfen, haben die Forscher die Kristallstrukturen von zwei Protein-Ligand-Komplexen aufgelöst: das Cortisol-bindende Protein hcy129 und das Apixaban-bindende Protein apx1049. Dabei wurde die Oberfläche von hcy129 mit ProteinMPNN neu entworfen, um die Kristallinität zu verbessern, und erfolgreich eine hochaufgelöste Struktur des Komplexes mit Cortisol mit einer Auflösung von 1,5 Å erhalten. Der Strukturvergleich zeigt, dass die Gesamtfaltung mit dem Entwurfsmuster in hohem Maße übereinstimmt, wobei der Cα-RMSD 1,1 Å beträgt (Abbildung A unten), und die Schlüsselwasserstoffbrückenbindungsreste sowie die Ligandenkonformation auch exakt übereinstimmen (Abbildung B unten), was zeigt, dass das vorkonstruierte Wasserstoffbrückennetzwerk (HBNet) die präzise Gestaltung polarer Wechselwirkungen erfolgreich umgesetzt hat.

Strukturanalyse der entworfenen Cortisol- und Apixaban-bindenden Proteine

Andererseits hat die Kristallstruktur des Komplexes aus apx1049 und Apixaban eine Auflösung von 2,1 Å und stimmt noch besser mit dem Entwurfsmuster überein, wobei der Cα-RMSD im Bereich von 113 Resten nur 0,6 Å beträgt (Abbildung C unten). Die Protein-Ligand-Wechselwirkungen imitieren fast vollständig den Entwurf, einschließlich der Schlüsselwasserstoffbrückenbindungen und der π-π-Stapelung zwischen aromatischen Resten (Abbildung D unten), wodurch die Ligandenkonformation stabilisiert und eine Bindetasche mit hoher Formkomplementarität gebildet wird. Diese Ergebnisse belegen, dass die Entwurfstrategie auf atomarer Ebene eine hochpräzise Konstruktion der Protein-Ligand-Grenzfläche ermöglicht.

Strukturanalyse der entworfenen Cortisol- und Apixaban-bindenden Proteine

Spezifitätsbewertung der entworfenen Bindeproteine

Um die Spezifität der entworfenen Proteine zu bewerten, haben die Forscher sechs Bindeproteine und sechs Liganden systematisch getestet und Albumin mit unspezifischer Bindungsfähigkeit als Kontrolle herangezogen. Die Ergebnisse zeigen, dass hochaffine Proteine wie hcy129.1, iri807.1 und apx1049 sowohl eine gute Spezifität bei der Bindung an ihre jeweiligen Zielmoleküle aufweisen, während Albumin an die meisten Liganden kaum bindet, was die Wirksamkeit der Entwurfstrategie bestätigt.

Darüber hinaus ist in der Warfarin-(WRF-)Reihe die Bindungsaffinität von Albumin (KD ca. 5,0 μM) ähnlich der des entworfenen Proteins wrf1071 (KD ca. 1,1 μM), was zeigt, dass die unspezifische Bindung bei hydrophoberen Liganden immer noch eine Herausforderung darstellt.

Insgesamt kann diese Methode bereits einen gewissen Grad an hochspezifischer Erkennung erreichen, es besteht jedoch noch Raum für weitere Optimierungen bei der Unterscheidung strukturell ähnlicher Moleküle und der Verbesserung der Selektivität für hydrophobe Liganden.

Konstruktion eines Biosensors (Entwurf und Charakterisierung eines Cortisol-induzierten Heterodimers)

Cortisol kommt in physiologischen Proben normalerweise in niedrigen Nanomolarkonzentrationen vor, und wenn der Plasmacortisolspiegel über 38 nM liegt, kann dies als diagnostisches Kriterium für Krankheiten wie das Cushing-Syndrom dienen. Um die Bindungsaffinität von hcy129 an Cortisol für die Biosensorik zu verbessern, haben die Forscher auf der Grundlage vorteilhafter Mutationen, die in einem Einzelpunkt-Sättigungsmutations-(SSM-)Experiment ausgewählt wurden, eine kombinatorische Mutantenbibliothek erstellt und durch Hefedisplay selektiert. Dabei wurde eine signifikante Verbesserung der Bindungsaffinität beobachtet, wie in der folgenden Abbildung gezeigt: