Nature lobt: Die neueste Arbeit von Harvard und MIT - Die Ära der KI-Wissenschaftler ist da!
Die Ära der KI-Wissenschaftler rückt näher. Das neueste ToolUniverse von Harvard und MIT ermöglicht es KI-Systemen über eine einheitliche Plattform, mit natürlicher Sprache über 600 wissenschaftliche Tools zu bedienen, was die Automatisierung der wissenschaftlichen Forschung auf ein neues Niveau hebt und einen neuen Paradigmenwechsel in der wissenschaftlichen Entdeckung einläutet.
Jeder Sprung in der Wissenschaftsgeschichte war meist von einer Umschwung in den Werkzeugen begleitet. Mit der rasanten Entwicklung von Large Language Models (LLMs) und Agenten in letzter Zeit geht dieser Weg in eine völlig neue Phase über: die Ära der "KI-Wissenschaftler".
An der Spitze der KI-unterstützten Forschung erleben wir einen wichtigen Meilenstein: Wir wandeln uns von der Frage, ob ein KI-Agent bestimmte wissenschaftliche Probleme lösen kann, hin zu Überlegungen, wie er effizient, zuverlässig und skalierbar in den gesamten Forschungsablauf eingebunden werden kann.
Eine neu veröffentlichte Analyse in der Zeitschrift Nature berichtet über das erste Open-Source-Framework für Tools im großen Stil, das von Marinka Zitniks und Gao Shanghua's Team von Harvard University sowie dem MIT entwickelt wurde: ToolUniverse.
Link zur Nachricht: https://www.nature.com/articles/d41586-025-03246-7
Die offene Online-Umgebung von ToolUniverse ermöglicht es Forschern, verschiedene LLMs und Agenten mit natürlicher Sprache an gängige Tools aus verschiedenen wissenschaftlichen Bereichen anzuschließen, was die Grundlage für die Schaffung von KI-Wissenschaftlern legt.
Projekt-Homepage: https://aiscientist.tools
Detailierte Analyse der Studie: https://arxiv.org/abs/2509.23426
Quellcode auf GitHub: https://github.com/mims-harvard/ToolUniverse
Warum brauchen wir KI-Wissenschaftler, wenn KI-Generierungsmodelle nicht mehr ausreichen?
Die Kernfähigkeit traditioneller LLMs ist die "Textgenerierung", aber die wissenschaftliche Forschung erfordert weitaus mehr:
Sie erfordert die Zerlegung komplexer Probleme (z. B. "Wie kann man Cholesterin senkende Medikamente optimieren?"), die Planung von Experimenten, den Einsatz spezifischer Tools (z. B. Software zur Molekülsimulation), die Validierung der Plausibilität von Daten und sogar die Selbstkorrektur, wenn die Ergebnisse von den Erwartungen abweichen. Dieser "Rückkopplungsmechanismus von Schlussfolgerung und Handlung" ist der Schlüssel, um KI von einem "Modell" zu einem "Wissenschaftler" zu machen.
Der Durchbruch bei KI-Agenten liegt in der tiefen Kopplung von LLMs mit drei Mechanismen:
- Planungsfähigkeit: Die Aufgabe "Neue Medikamente entdecken" wird in ausführbare Schritte wie "Zielidentifizierung → Verbindungssichtung → Eigenschaftsoptimierung → Patentüberprüfung" zerlegt;
- Speichersystem: Das Nachverfolgen von Zwischenergebnissen (z. B. "Die Permeabilität einer bestimmten Verbindung in der Lebergewebe"), um wiederholte Berechnungen oder logische Lücken zu vermeiden;
- Tool-Einsatz: Der Anschluss an externe Datenbanken, Simulatoren und Analyseprogramme, um die Schwächen von LLMs bei spezifischen Berechnungen (z. B. der Vorhersage der Molekülbindungsenergie) auszugleichen.
Aber die Besonderheiten der wissenschaftlichen Forschung stellen höhere Anforderungen an KI-Agenten: Die Formate der Tools in verschiedenen Disziplinen (Biologie, Chemie, Physik) sind nicht einheitlich, die Daten müssen reproduzierbar sein und die experimentellen Abläufe müssen streng validiert werden.
Allgemeine Protokolle für den Tool-Einsatz (z. B. MCP, Model Context Protocol) können spezifische Probleme wie "Wie kann man KI dazu bringen, das Format von Massenspektrometriedaten zu verstehen?" oder "Wie kann man die Ausgabe von Molekülsimulationen und klinischen Datenbanken koordinieren?" nicht lösen. Und genau hier setzt ToolUniverse an.
ToolUniverse: Das ökologische Fundament für wissenschaftliche KI-Agenten
ToolUniverse ist kein einzelnes Tool, sondern ein standardisiertes Ökosystem, das "LLMs mit wissenschaftlichen Tools verbindet" (Abbildung 1).
Das Kernziel ist: Jedes LLM soll über eine einheitliche Schnittstelle auf über 600 wissenschaftliche Tools zugreifen können, um die gesamte Forschungsarbeit von der "Hypothesenstellung" bis zur "Validierung der Ergebnisse" zu bewältigen.
Abbildung 1: ToolUniverse ist ein Ökosystem zur Schaffung von KI-Wissenschaftlern. Allgemeine LLMs, Inferenzmodelle und Agenten können sich an über 600 wissenschaftliche Tools anschließen, um die Automatisierung des Forschungsablaufs zu erreichen.
Das "HTTP" für die Vereinheitlichung von wissenschaftlichen Tools: Lösung von drei Problemen
Genau wie das HTTP-Protokoll die Internetkommunikation vereinheitlicht hat, definiert ToolUniverse ein spezielles "Standardprotokoll für die Interaktion mit wissenschaftlichen Tools" (Abbildung 2). Es kann sowohl lokal installierte Open-Source-Tools nahtlos integrieren als auch sicher und ordnungsgemäß an leistungsstarke Closed-Source-Modelle und API-Services anschließen. Dadurch werden drei Probleme des MCP-Protokolls in der wissenschaftlichen Forschung gelöst:
Abbildung 2: ToolUniverse verbindet Machine Learning-Modelle, Agenten, wissenschaftliche Softwaretools, Datenbanken und APIs über ein einheitliches Protokoll. Es führt ein standardisiertes Rahmenwerk für die Tool-Spezifikation ein, das es Sprachmodellen ermöglicht, verschiedene Tools konsistent zu entdecken, aufzurufen und zu analysieren. Ähnlich wie das HTTP-Protokoll Standards für die Internetkommunikation festlegt, definiert das ToolUniverse-Protokoll über zwei Kernoperationen - Find Tool (Tool finden) und Call Tool (Tool aufrufen) - wie KI-Wissenschaftler Tools anfordern und Ergebnisse empfangen können.
- Schwierigkeit bei der Tool-Entdeckung: Mit der Komponente "Tool Finder" kann KI die Anforderungen präzise aus über 600 Tools auswählen, indem es Schlüsselwortsuche, Vektor-Embedding-Suche und LLM-Inferenz kombiniert (z. B. bei der Anforderung "Vorhersage der Lebertoxizität von Verbindungen" wird automatisch das ADMET-AI-Tool gefunden);
- Unspezifischer Tool-Einsatz: Die Komponente "Tool Caller" validiert zunächst die Eingabe (z. B. ob das Molekülstrukturformat dem SMILES-Standard entspricht), führt dann das Tool aus und wandelt die Ausgabe in strukturierte Daten um (z. B. "Bindungsenergie - 8,2 kcal/mol" anstelle von ungeordnetem Text);
- Schwierigkeit bei der Rückkopplung der Inferenz: Eine neue "Inferenzsteuerungsebene" ermöglicht es KI, die wissenschaftliche Bedeutung der Tool-Ausgabe zu verstehen (z. B. "Diese Verbindung hat eine hohe Hirnpermeabilität → möglicherweise zentrale Nebenwirkungen"), anstatt nur mechanisch Tools aufzurufen.
Diese standardisierte Gestaltung ermöglicht es KI, sich von "Tool-Benutzer" zu "Problemlöser mit wissenschaftlichen Tools" zu entwickeln.
Vier Kernkomponenten: Unterstützung des gesamten Lebenszyklus von KI-Wissenschaftlern
ToolUniverse deckt mit seinen vier Komponenten (Abbildung 3) alle Anforderungen von KI-Wissenschaftlern vom "Tool-Zugang" bis zur "Optimierung des Workflows" ab und ermöglicht so wirklich "programmierbare wissenschaftliche Zusammenarbeit".
Abbildung 3: ToolUniverse bietet sechs Schlüsselkompetenzen, die den gesamten Lebenszyklus von KI-Wissenschaftlern unterstützen:
Tool Manager: Das "Registrierungs- und Verwaltungszentrum" für Tools
Es löst das Problem, wie neue Tools in das Ökosystem integriert werden können:
Lokale Tools (z. B. selbst entwickelte Datenanalyse-Skripte in einem Labor) können einfach mit einer "Funktionsbeschreibung + Parameterformat + Ausgabebeispiel" in das einheitliche Schema aufgenommen werden;
Remote-Tools (z. B. Cloud-basierte Plattformen für Molekülsimulationen) können über das MCP-Protokoll angeschlossen werden, ohne dass der interne Code preisgegeben werden muss, was sowohl Sicherheit als auch Kompatibilität gewährleistet;
Die Wirksamkeit der Tools wird automatisch validiert (z. B. ob eine Fehlermeldung bei falscher Eingabe der Molekülstruktur angezeigt wird), um die Zuverlässigkeit bei der KI-Nutzung zu gewährleisten.
Tool Composer: Der "Architekt" für wissenschaftliche Workflows
Die wissenschaftliche Forschung beruht selten auf einem einzigen Tool. Beispielsweise erfordert die "Medikamentensichtung" die Kopplung von "Ziel-Datenbank → Verbindungslibrary → Moleküldocking-Tool → Toxizitätsvorhersage-Tool". Die Aufgabe des Tool Composer ist es:
Den Datenfluss zwischen Tools zu definieren (z. B. "Die Ausgabe des Moleküldocking-Tools wird direkt als Eingabe für das Toxizitätsvorhersage-Tool verwendet");
Bedingte Logik zu unterstützen (z. B. "Wenn die Toxizitätsvorhersage überschritten wird, wird zum vorherigen Schritt zurückgekehrt, um Verbindungen erneut zu sichten");
Einen reproduzierbaren Workflow-Skript zu generieren, um es für menschliche Wissenschaftler einfacher zu machen, ihn nachzuvollziehen oder zu ändern.
Durch das Agentensystem wird die automatische Konstruktion und Optimierung der Tool-Nutzungsverhältnisse ermöglicht.
Tool Discover: Der "Automatische Generator" für Tools
Wenn die vorhandenen Tools die Anforderungen nicht erfüllen (z. B. "Es wird ein neues Tool zur Visualisierung von Genexpressionsdaten benötigt"), kann KI die Anforderungen in natürlicher Sprache beschreiben. Dann wird von Tool Discover folgendes getan:
Die Textdarstellung wird in strukturierte Tool-Spezifikationen umgewandelt (z. B. "Eingabe: Expressionsmatrix im CSV-Format; Ausgabe: Heatmap + Volcano-Plot");
Code und Testfälle werden automatisch generiert und durch einen Rückkopplungszyklus von "erwartetes Verhalten vs. tatsächliche Ausgabe" optimiert;
Ohne manuelle Codierung kann die Tool-Bibliothek dynamisch erweitert werden, um den Forschungsanforderungen gerecht zu werden.
Tool Optimizer: Der "Qualitätsschützer" für Tools
Die wissenschaftliche Forschung legt großen Wert auf Reproduzierbarkeit. Der Tool Optimizer gewährleistet die Stabilität der Tools durch drei Maßnahmen:
Regelmäßige Generierung von Testfällen (z. B. "Validierung der Genauigkeit des Moleküldocking-Tools mit Verbindungen bekannter Aktivität");
Analyse der Abweichungen zwischen Tool-Ausgabe und Spezifikation (z. B. "Der Fehler zwischen der vorhergesagten Bindungsenergie eines Tools und dem experimentellen Wert erhöht sich plötzlich");
Automatische Aktualisierung der Tool-Dokumentation oder der Parametersätze, um die Konsistenz bei der KI-Nutzung zu gewährleisten.
Kompatibilität mit verschiedenen Modellen: Jedes LLM kann ein wissenschaftlicher Helfer werden
Die Anforderungen an LLMs in verschiedenen Forschungsbereichen variieren stark: Die lokale Analyse in einem Labor erfordert möglicherweise lightweight Open-Source-Modelle (z. B. Llama 3), während die komplexe Hypothesen-Inferenz möglicherweise auf Cloud-basierte Large Language Models angewiesen ist (z. B. Claude 3). In der biomedizinischen Forschung werden spezielle Modelle benötigt (z. B. TxAgent).
Die kompatible Gestaltung von ToolUniverse überwindet die Beschränkung der "Modellbindung" (Abbildung 4): Der Tool-Einsatz wird in "standardisierte Funktionsaufrufe" umgewandelt, ohne dass die Gewichte oder der Tokenizer des LLMs geändert werden müssen - lediglich über einen lightweight Wrapper werden dem Modell die "Tool-Liste + Parameterformat" übergeben, und die Modellausgabe kann dann in Tool-Aufruf-Befehle übersetzt werden.
Der Wert dieser Gestaltung liegt darin:
Forschungsgruppen können Modelle je nach Kosten- und Datenschutzanforderungen auswählen, ohne befürchten zu müssen, dass der Tool-Einsatzlogik neu geschrieben werden muss, wenn das Modell gewechselt wird;
Die Leistung verschiedener Modelle kann unter denselben experimentellen Bedingungen verglichen werden (z. B. "Welches Modell ist genauer bei der Medikamentensichtung, Gemini-CLI oder Claude 3?");
Die Kombination von spezifischen Modellen und allgemeinen Tools wird unterstützt (z. B. "TxAgent ruft die ChEMBL-Datenbank auf, um die Wechselwirkungen zwischen Medikamenten und Zielproteinen zu analysieren").