StartseiteArtikel

Mitglieder des Claude Code Teams berichten aus erster Hand: Wie man dynamische Arbeitsabläufe richtig nutzt

机器之心2026-06-05 15:00
Harness für alle Aufgaben.

Letzte Woche hat Claude Code eine neue Fähigkeit eingeführt: dynamische Workflows.

Diese Funktion ermöglicht es Claude, auf Basis eines konkreten Tasks sofort ein maßgeschneidertes Ausführungsframework zu erstellen und mehrere Sub-Agenten parallel zu koordinieren, um das Problem des systemischen Versagens bei großen, hochparallelen und wettbewerbsorientierten Aufgaben zu lösen.

Kürzlich hat der Anthropic-Ingenieur Thariq einen ausführlichen Artikel veröffentlicht, in dem er seine ersten Erfahrungen und Erkenntnisse über Workflows teilt.

Wir haben diesen Artikel vollständig übersetzt und zusammengefasst.

Bevor Thariq in die technischen Details eintaucht, gibt er einige Beispielhinweise, um uns das Potenzial von Workflows zu verdeutlichen:

  • „Dieser Test scheitert möglicherweise einmal alle 50 Durchläufe. Setze einen Workflow ein, um den Test wiederholt auszuführen, Hypothesen zu entwickeln und diese in einem Arbeitsbaum gegenläufig zu validieren / Ziel: Versuche so lange, bis eine Hypothese erfolgreich ist.“
  • „Verwende einen Workflow, um meine letzten 50 Sitzungen zu überprüfen, die wiederkehrenden Fehler zu identifizieren und diese wiederkehrenden Probleme in CLAUDE.md-Regeln umzuwandeln.“
  • „Durchsuche mit einem Workflow den #incidents-Kanal in Slack der letzten sechs Monate, um die wiederkehrenden Ursachen zu finden, für die noch kein Ticket eingereicht wurde.“
  • „Nimm meinen Geschäftsplan und führe einen Workflow aus, der verschiedene Agenten anleitet, ihn aus der Perspektive von Investoren, Kunden und Konkurrenten zu zerlegen.“
  • „Hier ist ein Ordner mit 80 Lebensläufen. Verwende einen Workflow, um sie zu bewerten, die besten Kandidaten für die Backend-Stelle auszuwählen und die Top-Ten zu überprüfen. Verwende das AskUserQuestion-Tool, um die Bewerber zu bewerten.“
  • „Ich brauche einen Namen für dieses CLI-Tool. Verwende einen Workflow, um mehrere Optionen zu generieren und in einem Turnier die besten drei Vorschläge auszuwählen.“
  • „Verwende einen Workflow, um unser User-Modell in Account umzubenennen.“
  • „Prüfe meinen Blogartikeldraft. Verwende einen Workflow, um zu überprüfen, ob jede technische Aussage mit der Codebasis übereinstimmt, um sicherzustellen, dass keine fehlerhaften Informationen veröffentlicht werden.“

Wie funktionieren dynamische Workflows?

Dynamische Workflows führen eine JavaScript-Datei aus, die spezielle Funktionen enthält. Diese Funktionen helfen bei der Generierung und Koordination von Sub-Agenten.

Darüber hinaus umfassen dynamische Workflows auch Standard-JavaScript-Funktionen wie JSON, Math und Array zur Datenverarbeitung.

Dynamische Workflows können bestimmen, welche Modellart ein Agent verwendet und ob Sub-Agenten in einem unabhängigen Arbeitsbaum ausgeführt werden. Dadurch kann Claude das erforderliche Intelligenzniveau und die Isolationsart auswählen.

Wenn ein Workflow unterbrochen wird, beispielsweise durch eine Benutzeraktion oder das Beenden des Terminals, kann der Workflow beim Wiederherstellen der Sitzung an der Unterbrechungsstelle fortgesetzt werden.

Warum sollten Sie dynamische Workflows verwenden?

Wenn wir die Standard-Claude Code-Architektur verwenden, um Aufgaben auszuführen, muss sie Planung und Ausführung in demselben Kontextfenster durchführen. Dies funktioniert für viele Programmieraufgaben gut, kann aber bei langlaufenden, hochparallelen oder stark strukturierten wettbewerbsorientierten Aufgaben Probleme verursachen.

Der Grund dafür ist, dass Claude desto eher einem der folgenden Versagensmuster unterliegt, je länger es komplexe Aufgaben in einem einzigen Kontextfenster bearbeitet:

  • Agentische Faulheit (Agentic laziness): Claude kann bei der Bearbeitung komplexer mehrstufiger Aufgaben vorzeitig aufhören und behaupten, die Aufgabe sei abgeschlossen. Beispielsweise werden nur 20 von 50 Sicherheitsüberprüfungen durchgeführt.
  • Selbstpräferenzverzerrung (Self-preferential bias): Claude neigt dazu, seine eigenen Ergebnisse oder Entdeckungen zu bevorzugen, insbesondere wenn es um die Validierung oder Bewertung geht.
  • Zielabweichung (Goal drift): Bei mehrfachen Aktionen kann sich das Aufgabenziel allmählich ändern. Insbesondere nach einer komprimierten Zusammenfassung können Details wie Randfälle oder „Verbot von X“ verloren gehen.

Die Erstellung von Workflows kann diese Probleme vermeiden, indem Claude-Instanzen mit unabhängigen Kontextfenstern für verschiedene Ziele zugewiesen werden. Jede Instanz konzentriert sich auf ein isoliertes Aufgabenziel.

Unterschied zwischen dynamischen und statischen Workflows

Sie haben möglicherweise bereits statische Workflows mit dem Claude Agent SDK oder claude -p erstellt, um mehrere Claude Code-Instanzen zu koordinieren.

Statische Workflows müssen alle Extremfälle berücksichtigen und sind daher in der Regel allgemeiner. Mit den dynamischen Workflows von Claude Opus 4.8 kann Claude nun ein intelligentes Framework generieren, das auf Ihre spezifischen Anwendungsfälle zugeschnitten ist.

Häufige Muster von dynamischen Workflows

Sie können Claude direkt bitten, einen dynamischen Workflow zu generieren, oder das Triggerwort „ultracode“ verwenden, um sicherzustellen, dass Claude Code einen Workflow erstellt.

Das Verständnis der häufigen Muster von dynamischen Workflows hilft Ihnen, zu entscheiden, wann Sie sie verwenden und wie Sie Claude durch Hinweise anleiten können:

  • Klassifizieren und handeln (Classify-and-act): Verwende einen Klassifikator-Agenten, um den Aufgaben-Typ zu bestimmen, und leite die Aufgabe dann an verschiedene Agenten oder Aktionen weiter. Ein Klassifikator kann auch am Ende verwendet werden, um die Ausgabe zu beurteilen.
  • Verteilen und zusammenfassen (Fan-out-and-synthesize): Teile die Aufgabe in mehrere kleine Schritte auf, die von einem Agenten bearbeitet werden, und fasse dann die Ergebnisse zusammen. Dies eignet sich besonders für viele kleine Schritte oder Schritte, die einen unabhängigen Kontext erfordern. Der Zusammenfassungsschritt wartet, bis alle verteilten Agenten fertig sind, und kombiniert dann die strukturierten Ausgaben.
  • Gegenläufige Validierung (Adversarial verification): Die Ausgabe jedes Sub-Agenten wird von einem anderen Agenten anhand von Bewertungskriterien gegenläufig validiert.
  • Generieren und filtern (Generate-and-filter): Generiere mehrere Ideen und filtere sie anhand von Bewertungskriterien. Entferne Duplikate und gib nur hochwertige und validierte Ideen zurück.
  • Turnier (Tournament): Lasse mehrere Agenten die gleiche Aufgabe auf verschiedene Weise ausführen. Ein Bewertungs-Agent vergleicht dann die Ergebnisse paarweise und wählt das beste aus.
  • Schleife bis abgeschlossen (Loop until done): Bei Aufgaben mit unbekanntem Arbeitsaufwand generiere Agenten in einer Schleife, bis die Stoppbedingung erfüllt ist (keine neuen Entdeckungen oder keine weiteren Fehler im Log), anstatt eine feste Anzahl von Durchläufen auszuführen.

Anwendungsfälle

Migration und Refactoring

Die Umstellung von Bun von Zig auf Rust wurde mit Workflows durchgeführt.

Der Schlüssel besteht darin, die Aufgabe in eine Reihe von kleinen Einheiten aufzuteilen, die schrittweise bearbeitet werden können, wie z. B. Aufrufstellen, fehlgeschlagene Tests, Module usw. Jede Reparatur wird von einem Sub-Agenten in einem unabhängigen Arbeitsbaum durchgeführt. Anschließend wird ein anderer Agent für eine gegenläufige Prüfung eingesetzt, und erst nach Bestätigung wird die Änderung zusammengeführt.

Wenn Sie so viel wie möglich parallelisieren möchten, ohne die Ressourcen Ihres lokalen Computers zu überlasten, können Sie den Agenten explizit anweisen, keine ressourcenintensiven Befehle auszuführen.

Tiefgehende Recherche

Wir haben in Claude Code eine Funktion für tiefgehende Recherche (/deep-research) veröffentlicht, die dynamische Workflows verwendet.

Genauer gesagt führt sie parallele Web-Suchen durch, sammelt Quellen und führt eine gegenläufige Validierung der Aussagen durch. Am Ende wird ein recherchierter Bericht mit Verweisen erstellt.

Diese Art der Recherche ist jedoch nicht auf Web-Suchen beschränkt. Beispielsweise können Sie Claude auch bitten, aus dem Slack-Kontext einen Statusbericht zu erstellen oder den Codebasis zu durchsuchen, um zu untersuchen, wie eine bestimmte Funktion implementiert ist.

Tiefgehende Validierung

Wenn Sie einen Bericht haben und jede zitierte Tatsachenaussage und ihre Quelle überprüfen möchten, können Sie einen Workflow erstellen: Zunächst identifiziert ein Agent alle Tatsachenaussagen. Anschließend wird ein Sub-Agent abgeleitet, um jede Aussage gründlich zu überprüfen. Darüber hinaus können Sie einen Validierungs-Agenten einführen, der den Sub-Agenten, der die Quellen recherchiert, überprüft, um sicherzustellen, dass die verwendeten Quellen von hoher Qualität sind.

Sortierung

Sie haben möglicherweise eine Reihe von Einträgen, die Sie nach einem bestimmten qualitativen Kriterium sortieren möchten, das Claude Code gut beurteilen kann. Beispielsweise können Sie Support-Tickets nach der Schwere des Bugs sortieren.

Wenn Sie jedoch versuchen, 1000 Zeilen in einem Prompt auf einmal zu verarbeiten, sinkt die Qualität leicht, und der Kontext reicht nicht aus. Eine bessere Methode ist es, ein „Turnier“ durchzuführen: Erstellen Sie eine Pipeline aus paarweisen Vergleichs-Agenten. Paarweise Vergleiche sind in der Regel zuverlässiger als die direkte Vergabe absoluter Punkte.

Sie können auch zuerst parallel in Buckets sortieren und dann die Ergebnisse zusammenfassen. Jeder Vergleich wird von einem unabhängigen Agenten durchgeführt. Eine deterministische Schleife verwaltet das Turnier-Schema. Im Kontext bleibt nur die aktuelle Ausführungsreihenfolge.

Erinnerung und Regelfolgen

Wenn Sie feststellen, dass Claude trotz Eingabe von Regeln in CLAUDE.md diese häufig übersieht oder nicht richtig ausführt, können Sie einen speziellen Workflow erstellen: Listen Sie diese Regeln auf und lassen Sie einen Validierungs-Agenten sie nacheinander überprüfen. Jede Regel entspricht einem Validierungs-Agenten.

Erstellen Sie außerdem einen Sub-Agenten mit einer skeptischen Perspektive, der überprüft, ob diese Regeln sinnvoll sind und ob sie wirklich mit dem Ziel übereinstimmen. Dies kann die Anzahl von Fehlalarmen reduzieren.

Das Gegenteil ist ebenfalls möglich: Sie können aus Ihren letzten Sitzungen und Code-Review-Kommentaren die Probleme herausfinden, die Sie wiederholt korrigiert haben. Lassen Sie dann mehrere Agenten diese parallel kategorisieren und zusammenfassen. Anschließend führen Sie eine gegenläufige Validierung für jede Kandidaten-Regel durch, z. B. indem Sie fragen: Hätte diese Regel damals wirklich einen echten Fehler verhindert? Schließlich extrahieren Sie die validierten Regeln wieder in CLAUDE.md.

Ursachenforschung

Die effektivste Methode zum Debuggen besteht in der Regel darin, mehrere unabhängige Hypothesen zu stellen und sie dann nacheinander zu überprüfen. Wenn Sie jedoch nur auf ein Kontextfenster verlassen, kann Claude leicht in eine Art „Selbstpräferenz“ geraten: Je mehr es sich mit seiner ursprünglichen Einschätzung beschäftigt, desto stärker glaubt es an sie.

Workflows können dies strukturell vermeiden. Sie ermöglichen es mehreren Agenten, auf der Grundlage voneinander isolierter Beweise Hypothesen zu stellen. Beispielsweise kann ein Agent nur die Logs betrachten, ein anderer nur die Dateien und ein weiterer nur die Daten. Anschließend werden jede Hypothese von einer Gruppe von Validatoren und Widersprechern überprüft.

Diese Methode ist nicht nur auf Code anwendbar. Sie kann auch in Verkaufsszenarien verwendet werden, z. B. um zu analysieren, warum der Umsatz im März gesunken ist, oder in der Datenverarbeitung, um zu ermitteln, warum eine Datenpipeline fehlgeschlagen ist. Jede Aufgabe, die eine Rückbetrachtung und die Ermittlung der Urs