Das „Loop-Projekt“, an dem alle globalen Agenten arbeiten: Die KI erledigt die Arbeit, überwacht sie und korrigiert sie selbst
Gestern hat Xiaolei einen Beitrag von Andrew Ng auf X entdeckt, der über die Loop-Engineering von Agenten handelt.
Bildquelle: X
Wenn Sie in den letzten sechs Monaten Claude Code, Codex, Workbuddy, Kimi Work oder andere Agent-Produkte verwendet haben, haben Sie vielleicht bereits die Veränderung gespürt. Im Vergleich zu früher, als man dem KI-System Schritt für Schritt sagen musste, was es tun soll, können Sie jetzt einfach Ihre Anforderungen eingeben, und es kann selbständig schreiben, ausführen, Fehler erkennen und beheben, bis die Aufgabe erledigt ist.
Dieses Gefühl des "Selbstlaufens" ist die Umsetzung der Loop-Engineering in Agent-Produkten.
"... Sie sollten nicht mehr Anweisungen für Coding-Agenten schreiben, sondern Loops entwerfen." Im Juni hat ein Tweet von Peter Steinberger, dem Gründer von OpenClaw, zahlreiche Diskussionen ausgelöst. Tatsächlich hat kurz zuvor Addy Osmani, der Google-Engineering-Verantwortliche, das Konzept des Loops systematisch zusammengefasst und die Loop-Engineering eingeführt.
Bildquelle: X
Aus den öffentlichen Informationen geht hervor, dass Boris Cherny, der Gründer von Claude Code, derjenige war, der zuerst den Loop vorgeschlagen und ihn auch erfolgreich umgesetzt hat. Ende Juni hat Anthropic einen Blogbeitrag veröffentlicht, in dem alle vier Loop-Primitive in Claude Code offen gelegt wurden.
In einem Monat hat sich die Loop-Engineering nahezu komplett gewandelt. Sie ist nicht nur ein Branchenkonsens, sondern auch im Mittelpunkt der Aufmerksamkeit geworden. Also, was genau ist ein Loop? Und was bedeutet es für uns normale Benutzer?
Was hat der Agent von der Anweisung über die Harness bis zur Loop hinzugelernt?
In der Vergangenheit war die Anweisung (Prompting) ein unverzichtbarer Bestandteil der KI-Nutzung. Wenn Sie das Modell auffordern, Code zu schreiben, Dokumente zu bearbeiten oder Recherchen durchzuführen, desto detaillierter die Anweisung ist, desto besser ist das Ergebnis. Wenn man von Modellen zu Agenten übergeht, muss das System nicht nur antworten, sondern auch wissen, wann es Dateien lesen, Befehle ausführen, Webseiten durchsuchen oder nachfragen soll. Die Anweisungstechnik und die Denkkette reichen hierfür einfach nicht aus.
Daher ist die Harness-Engineering entstanden. Man kann sie als das Rahmenwerk verstehen, das um das Modell herum liegt und für die Anbindung von Tools, die Verwaltung von Rechten, die Bereitstellung von Kontext und die Speicherung von Zuständen verantwortlich ist. Das Modell ist weiterhin für die Inferenz und die Generierung zuständig, aber es wird nun in eine Umgebung gebracht, in der es Aufgaben ausführen kann.
Die Loop-Engineering geht einen Schritt weiter. Sie beschäftigt sich damit, wie Agenten um ein Ziel herum kontinuierlich "schleifen".
Die offizielle Dokumentation von "Lobster" sieht den Loop als "Grundlage". Bildquelle: OpenClaw
Einfach ausgedrückt: Der Benutzer gibt ein Ziel an, der Agent versteht die Aufgabe, sammelt den Kontext, ruft Tools auf, beobachtet das Ergebnis und prüft, ob die Aufgabe erledigt ist. Wenn nicht, wird er weiter bearbeiten, erneut ausführen und erneut prüfen. Dieser Prozess ähnelt dem Arbeitsalltag eines Menschen: Man erstellt eine Version, entdeckt Probleme, verbessert sie, bis das Ergebnis abgebbar ist.
Der Schwerpunkt des Loops liegt nicht im Wort "Schleife" selbst, sondern darin, was in der Schleife passiert.
Das Beispiel von Claude Code ist am typischsten. Es ist nicht einfach die Anbindung von Claude an das Terminal, sondern es lässt das Modell in einer while-Schleife wiederholt Tools aufrufen, Dateien bearbeiten, Befehle ausführen und die Rückgabewerte beobachten. Die wirklich komplexen Teile befinden sich außerhalb der Schleife: das Berechtigungssystem, die Kontextkompression, Plugins, Fähigkeiten, Hooks, Unter-Agenten und die Sitzungsspeicherung.
Ob ein Agent selbstständig funktioniert, hängt nicht davon ab, dass das Modell spontan ein paar Schritte weiterdenkt, sondern von einem ganzheitlichen Engineering-Design, das es vorantreibt.
Dies ist auch der Kernhintergrund, warum Andrew Ng diesmal über die Loop-Engineering spricht. Im Jahr 2026 haben Claude Code, Codex, ZCode, MiniMax Code und andere Agent-Produkte die Fähigkeit "schreiben - ausführen - Ergebnis prüfen - verbessern" bereits als Standardfähigkeit integriert.
Anthropic hat im Blog die Loops in vier Kategorien eingeteilt: turn-based (rundenbasiert), goal-based (zielorientiert), time-based (zeitgesteuert) und proactive (proaktiv).
- "Schreibe mir eine Anmeldeseite." Es schreibt, testet und verbessert. Das ist ein goal-based Loop.
- Wenn Sie eine Nachricht senden und es eine Antwort zurückgibt, handelt es sich um einen turn-based Loop.
- Ein time-based Loop ermöglicht es Ihnen, es alle zwei Stunden automatisch einen bestimmten Pull Request zu prüfen und bei Aktualisierungen für Sie die Überprüfung durchzuführen.
- Ein proactive Loop ist noch aggressiver. Er erkennt selbst Probleme und beginnt selbständig damit, etwas zu tun. Wenn beispielsweise die Testabdeckung sinkt, fügt er selbst Testfälle hinzu.
Zielorientierter Loop. Bildquelle: Anthropic
Die Tatsache, dass diese Diskussionen in den Monaten Mai und Juni plötzlich intensiver wurden, hängt auch mit dem Fortschritt der Produkte zusammen. Codex von OpenAI ist nicht nur ein Eingang, um Ihnen zu helfen, Code zu schreiben. Es kann in einer unabhängigen Umgebung Repositories lesen, Dateien bearbeiten, Tests ausführen und die Protokolle und Ergebnisse zurückgeben.
Bei Anthropic ist Claude Code fast das beste Beispiel für die Loop-Engineering. Der Satz von Boris Cherny "Schreiben Sie nicht mehr selbst Anweisungen, sondern lassen Sie einen Agenten Claude anweisen" klingt verwirrend, aber es bedeutet im Grunde, dass der Mensch nicht mehr für jeden Schritt der Kommunikation mit dem Modell verantwortlich ist, sondern für das Design eines Mechanismus, der das Modell kontinuierlich arbeiten lässt.
Dies ist auch der Grund, warum die Loop-Engineering für normale Benutzer wirklich interessant ist. Je besser die Loop-Engineering ist, desto mehr ähnelt der Agent einem Menschen, der Aufgaben übernehmen kann: Sie geben ihm die Richtung, er läuft selbst vorwärts; wenn er abirrt, kann er sich anhand des Feedbacks korrigieren; wenn er fertig ist, gibt er den Prozess und das Ergebnis Ihnen zur Prüfung.
Was bringt es uns normalen Leuten, die Anweisungen loszuwerden?
Der direkteste Nutzen des Agent Loops für normale Benutzer ist die Senkung der Schwierigkeit bei der Gestaltung von Anweisungen.
In der Vergangenheit war die Zusammenarbeit mit KI-Systemen wie die Zusammenarbeit mit einem intelligenten, aber unerfahrenen Praktikanten. Sie mussten ihm jeden Schritt erklären, wann er anhalten soll, wo er nach Informationen suchen soll und wo er nicht frei erfinden darf. Je detaillierter Sie ihn anweisen, desto besser ist seine Leistung; je vager Ihre Anweisungen, desto wahrscheinlicher geht er abirren.
Ein Agent mit guter Loop-Implementierung ist eher wie ein Mensch, der den grundlegenden Arbeitsablauf bereits kennt. Sie müssen ihm nicht jedes Mal sagen, "Wenn der Code fehlerhaft ist, korrigieren Sie ihn weiter", denn das Testen und das Nacharbeiten sind sowieso Teil der Schleife. Sie müssen nicht einmal den gesamten Kontext auf einmal in das Dialogfeld eingeben, denn der Agent kann über das Dateisystem, Suchtools, Gedächtnis und Indizes selbst die benötigten Informationen sammeln.
Dies wird die Beziehung zwischen Benutzer und KI verändern.
Früher mussten Benutzer bei der Schreibung von Anweisungen oft die Rolle eines Produktmanagers, Projektmanagers, Testingenieurs und Lehrers übernehmen. Sie mussten die Anforderungen definieren, die Schritte aufteilen, den Fortschritt überwachen und die Fehler korrigieren. Künftig werden Benutzer eher die Ziele setzen und die Ergebnisse prüfen.
Nehmen Sie beispielsweise an, Sie bitten einen Agenten, einen Reiseplan zu erstellen. Früher hätten Sie vielleicht schreiben müssen: Wie hoch ist das Budget, wie viele Tage dauert die Reise, zuerst Flugtickets suchen, dann Hotels suchen, auf den Verkehr achten, mir eine Tabelle geben und schließlich eine Zusammenfassung erstellen. Wenn die Loop gut implementiert ist, müssen Sie nur sagen: "Ich möchte nächsten Monat fünf Tage nach Tokio reisen, mein Budget ist mittelmäßig, ich möchte möglichst wenig Stress haben und möglichst viele Ausstellungen besuchen." Der Agent sollte dann in der Lage sein, selbständig die Zeit zu prüfen, die Preise zu vergleichen, die Route zu planen, Konflikte zu erkennen, ein Angebot zu machen und nach Ihrer Rückmeldung "Der zweite Tag ist zu voll" die Route automatisch neu zu planen.
Dies ist die erste Bedeutung des " Wettbewerbs um das Tötungsverbot von Anweisungen". Normale Benutzer müssen sich nicht mehr als Anweisungsexperten ausbilden, die Agent-Produkte sollten die komplexen Abläufe für die Benutzer übernehmen.
Andererseits ist die Softwareentwicklung natürlich gut geeignet für Loops. Die Ziele können als Issues definiert werden, der Prozess kann in Dateiänderungen aufgeteilt werden, die Tools können Tests ausführen und die Ergebnisse können mit diff und CI validiert werden. Wenn ein Agent einen Fehler macht, kann das System sofort die Fehlermeldung sehen; wenn er es repariert hat, kann es auch sehen, dass der Test bestanden wurde. Dieser Feedback-Kreislauf ist klar, überprüfbar und speicherbar. Deshalb haben Claude Code, Codex, ZCode, MiniMax Code zunächst in der Code-Szene eingesetzt.
Bildquelle: Zhipu Zcode
Aber der Code ist nur der Anfang. Recherchen, Tabellen, Präsentationen, Datenanalyse, Kundensupport-Tickets, juristische Recherchen, Personalauswahl, Betriebsüberwachung - all diese Bereiche haben ähnliche Merkmale: Die Aufgaben können nicht in einem Satz erledigt werden, aber die Erfolgsbedingungen können definiert werden, der Prozess kann aufgezeichnet werden und die Ergebnisse können überprüft werden.
Das ist der zweite Nutzen des Loops: die Steigerung der Produktivität bei komplexen Aufgaben. Der Mensch muss nicht mehr jeden Schritt überwachen, sondern ist für die Festlegung der Richtung, die Prüfung der Ergebnisse und die Anpassung der Spezifikationen verantwortlich. Der von Andrew Ng erwähnte "Entwickler-Feedback-Loop" bedeutet, dass die KI den internen Ausführungszyklus beschleunigen kann, aber der Mensch muss immer noch in einem höheren Zyklus die Richtigkeit der Richtung beurteilen.
Außerdem kann ein Agent mit schlechter Benutzererfahrung auf den ersten Blick als instabil, unkontrolliert bei der Verwendung von Tools und immer weiter abirrend erscheinen. Aus der Sicht der Engineering bietet der Loop jedoch genau die Möglichkeit, die Zuverlässigkeit zu verbessern.
Im Rahmen der Loop-Engineering-Design können die Gründe, warum ein Agent eine bestimmte Webseite durchsucht, eine Datei ändert, ein Tool aufruft oder die Aufgabe als abgeschlossen ansieht, aufgezeichnet werden. Die Reparaturmaßnahmen können zu Fähigkeiten werden, und die Projektregeln können in Dateien wie AGENTS.md, CLAUDE.md oder ähnlichen Speicherdokumenten geschrieben werden. Wenn der Agent das nächste Mal eine ähnliche Aufgabe ausführt, muss er nicht erneut von vorne beginnen.
Allerdings muss man klarstellen, dass der Loop nicht automatisch Zuverlässigkeit bringt. Tatsächlich kann ein schlecht entworfener Loop nur dazu führen, dass die Fehler schneller repliziert werden.
Abschluss
In den letzten drei Jahren hat sich die Art und Weise, wie wir KI nutzen, mehrfach gewandelt, aber die zugrunde liegende Logik ist gleich geblieben: Der Mensch gibt Anweisungen, die KI führt sie aus, und der Mensch beurteilt dann das Ergebnis. Der Mensch war immer im Zyklus und war der treibende Kern des gesamten Systems. Die Loop-Engineering verschiebt den Menschen erstmals aus dem Zentrum des Zyklus nach außen. Der Mensch ist nicht mehr der Fahrer, sondern der Navigator.
Die Auswirkungen dieser Veränderung werden tiefer greifen, als man vielleicht denkt. Für Entwickler wird die Kernkompetenz die Fähigkeit sein, Probleme zu definieren und Prüfkriterien zu entwerfen. Für Produkte wird die Iterationsgeschwindigkeit weiter beschleunigt, was die Produktteams dazu zwingt, die Benutzer und das Geschäft besser zu verstehen, denn die Technologie ist kein Hindernis mehr, sondern die Urteilsfähigkeit.
Natürlich basiert all dies auf einer Vorbedingung: Das Modell muss weiterhin stärker werden. Wie viele Schleifendurchläufe ein Loop ausführen kann und wie komplexe Aufgaben es bearbeiten kann, hängt am Ende von der Grundfähigkeit des Modells ab. Wenn das Modell schon nach ein paar Schritten abirrt, ist auch das feinste Loop-Design sinnlos.
Zum Glück hat sich die Verbesserungsgeschwindigkeit der Modelle in diesem Jahr nicht verlangsamt. GPT-5.5, Claude 5, GLM-5.2, M3, K2.6, DeepSeek V4 - alle Hersteller haben in sechs Monaten eine neue Generation aktualisiert, und jede Generation hat eine deutliche Verbesserung in der Agentenfähigkeit gezeigt.