Im ersten Quartal des Jahres 2026 absolvierte der AI-Agent seine Volljährigkeit.
Am 6. März 2026 bildete sich vor dem Tencent-Gebäude in Shenzhen eine Schlange von fast tausend Menschen. Sie standen nicht in der Schlange, um ein neues Smartphone zu kaufen, sondern um jemanden zu bitten, ihnen eine Software zu installieren. Der Schwarzmarktpreis für die Installation dieser Software stieg bis auf 1.000 Yuan. Die Bezirke Longgang und der High-Tech-Park in Wuxi haben diese Software sogar in ihre staatlichen Subventionsdateien aufgenommen. Sam Altman gestand, dass die ursprüngliche Entscheidung, die vollständige Kontrolle des Computers durch KI zu vermeiden, bei der Entwicklung von Produkten im Bereich der autonomen Fahrweise nur zwei Stunden Bestand hatte.
Diese Software heißt OpenClaw und ist ein quelloffener KI-Agent (Intelligenzagent).
Im ersten Quartal 2026 tauchten gleichzeitig fünf völlig unterschiedliche Agent-Produktformen auf. OpenClaw konzentriert sich auf persönliche Assistenten, Cowork auf Bürokooperation, Codex App auf langfristige Projektaufgaben, Perplexity Computer auf ein einheitliches Arbeitsplatzsystem und Tencent Cloud ADP auf Unternehmensplattformen.
Die Entscheidung von fünf Unternehmen, verschiedene Wege zu gehen, ist kein Zufall. Ein Zufall wäre, wenn ein Unternehmen versehentlich ein gutes Produkt entwickelt. Dass fünf Unternehmen gleichzeitig anfangen, kann nur eine Sache bedeuten: Ein bestimmtes grundlegendes Kriterium ist gerade erfüllt, und alle haben den Duft der Chancen gerochen.
In diesem Quartal interessieren uns nicht einzelne Ereignisse, sondern strukturelle Veränderungen, d. h. diejenigen Dinge, die die Spielregeln wirklich verändert haben.
Es gibt vier Kriterien für die Auswahl.
Erstens, Branchenweite Resonanz. Es handelt sich nicht um die individuelle Aktion eines Unternehmens, sondern um die gleichzeitige Bewegung mehrerer Unternehmen in eine Richtung. Fünf Unternehmen bringen gleichzeitig Agent-Produkte auf den Markt, mehrere Teams bauen gleichzeitig Bindungsrahmen und mindestens drei unabhängige Wege führen zur erfolgreichen rekursiven Entwicklung.
Wenn alle gleichzeitig anfangen, geht es nicht um die Vision eines einzelnen, sondern um die Veränderung der Grundlage.
Zweitens, Kausale Kopplung. Es sind nicht vier zufällig im selben Quartal auftretende Ereignisse, sondern die eine Sache führt direkt zur anderen. Entfernt man einen Schritt, funktioniert der Rest nicht mehr.
Drittens, Wahrnehmbare qualitative Veränderung. Dies zeigt, dass es sich bei diesen Trends nicht um kleine Fortschritte innerhalb der Branche handelt, sondern um die Überschreitung eines kritischen Punktes, der zu einer deutlichen Verbesserung führt, die auch von der breiten Öffentlichkeit wahrgenommen werden kann. Die Schlange vor dem Tencent-Gebäude in Shenzhen, um OpenClaw zu installieren, war in den sozialen Medien zu lesen, das "Hummerkrieg" wurde zum öffentlichen Thema und die Regierung hat Agenten in ihre Subventionsdateien aufgenommen. 22 % der Mitarbeiter nutzen OpenClaw heimlich, ohne dass die IT-Abteilung davon weiß. Wenn ein technologischer Trend die technologische Community verlässt und in die öffentliche Diskussion eingeht, ist er kein "Branchentrend" mehr, sondern ein Signal für einen Zeitalterwandel.
Viertens, Irreversible Kognition. Bestimmte Produkte können ersetzt werden und spezifische Rahmen können weiterentwickelt werden, aber die Ideen hinter diesen Trends bleiben bestehen. Die Einigkeit, dass "Agenten Disziplin benötigen", wird nicht rückgängig gemacht, die Richtung, dass "Erfahrungen von Agenten wiederverwendet werden sollten", wird nicht aufgegeben und die Erwartung, dass "Agenten sich selbst verbessern können", bleibt bestehen. Die Formen können sich ändern, aber die Kognition bleibt gleich.
Im ersten Quartal 2026 erfüllen genau vier Trends diese vier Kriterien.
1. Die Produktivierung von automatisierten KI-Agenten. Agenten können endlich unabhängig arbeiten und haben den Sprung von der Minute- zur Tageskalenderung geschafft.
2. Bindungsingenieurwesen. Agenten haben gelernt, Regeln zu befolgen. Innerhalb von sechs Wochen hat die Branche ein ganzes System von Disziplinarrahmen entwickelt.
3. Rekursive Entwicklung. Agenten beginnen, sich selbst zu verbessern. Sie tun nicht nur Aufgaben aus, sondern verbessern auch die Art und Weise, wie sie Aufgaben ausführen.
4. Skill-Ekosystem. Agenten beginnen, die Erfahrungen ihrer Vorgänger über das Skill-Modell zu erben. Das Branchenwissen der Menschen hat erstmals ein Format, das von Agenten direkt wiederverwendet werden kann.
Und diese vier Kräfte sind nicht nebeneinander, sondern bilden ein Rädchen.
Nachdem Agenten unabhängig arbeiten können, wird das Problem ihrer Unregelmäßigkeit sichtbar, was die Entwicklung des Bindungsingenieurwesens erzwingt. Das Bindungsingenieurwesen gibt den Agenten Disziplin, so dass die rekursive Entwicklung möglich wird. Die rekursive Entwicklung schafft die Notwendigkeit, Erfahrungen wiederzuverwenden, was das Skill-Ekosystem hervorbringt. Das Skill-Ekosystem wiederum ermöglicht es den Agenten, komplexere Aufgaben zu bewältigen, und das Rädchen dreht sich in die nächste Runde.
Das erste Quartal 2026 war das erste Quartal, in dem das Rädchen vollständig um eine Runde gedreht hat.
Am 10. April 2026 veröffentlichte Tencent News die "Whitepaper zur KI-Trendforschung 2026Q1" (im Folgenden "Whitepaper"). Dieser 59-seitige Bericht konzentriert sich auf die Funktionsweise des gesamten Rädchens.
Dieser Artikel ist eine Zusammenfassung des Whitepapers und gibt 25 konkrete Einschätzungen entlang dieser vier Kräfte.
01 Die Produktivierung von langfristigen Agenten ist ihr "Erwachsenenfest"
Bisher war der Agent wie ein Kind, das seine Talente zeigt. Es kann beeindruckende Tricks vorführen, aber man traut es nicht wirklich mit wichtigen Aufgaben. Frühere Modellvorführungen waren beeindruckend, aber nach fünf Schritten verloren sie das Gesamtbild und begannen, unsinnig zu agieren.
Im ersten Quartal hat sich dies geändert. Der Unterschied liegt nicht nur darin, dass das Modell intelligent ist, sondern dass der Agent endlich in der Lage ist, "während Sie schlafen, an der Arbeit zu bleiben".
Der Cursor Agent hat eine einzelne Aufgabe 36 Stunden lang ausgeführt. Claude Code hat an einem Tag bis zu 4 % des öffentlichen GitHub-Codes weltweit eingereicht, was einem geschätzten Jahresumsatz von etwa 2,5 Milliarden US-Dollar entspricht. Dario Amodei bestätigte, dass über 90 % des neuen Codes von der KI selbst geschrieben wurden. Ein Projektleiter bei Anthropic sagte sogar: "Ich schreibe keinen Code mehr. Ich lasse Opus es machen und bearbeite es dann." Anthropic hat innerhalb von 52 Tagen 74 Updates veröffentlicht. Codex hat über 1,6 Millionen wöchentliche aktive Benutzer erreicht und die Desktop-Anwendung wurde über eine Million Mal heruntergeladen.
Und der aufregendste OpenClaw hat in 60 Tagen die Anzahl seiner GitHub-Sterne von 9.000 auf 247.000 gesteigert und erreichte 2 Millionen monatliche aktive Benutzer.
Darüber hinaus nannte Karpathy das Moltbook, das 1,5 Millionen Agenten registriert hat, "die realistischste Annäherung an die Science-Fiction in der jüngsten Vergangenheit". OpenAI hat am Valentinstag die Übernahme des Gründers von OpenClaw angekündigt.
In China war die Reaktion noch heftiger. Mindestens neun Unternehmen haben im selben Quartal Desktop-Agent-Produkte auf den Markt gebracht. Tencent hat seine Produkte mit WeChat und Enterprise WeChat verknüpft, ByteDance hat Feishu und Cloud SaaS als Ankerpunkte gewählt, Alibaba hat mit Codierungstools begonnen und in die allgemeine Büroarbeit expandiert, und Baidu hat die Schwelle durch Suchfunktionen gesenkt. Die Branche nennt dies den "Hummerkrieg" - benannt nach dem Logo von OpenClaw, einem Hummer, der symbolisiert, dass der Agent endlich die Fähigkeit hat, Dinge zu greifen.
Agenten können tatsächlich unabhängig arbeiten. Aber warum genau jetzt?
Das Durchbrechen der Barrieren beruht nicht auf Fähigkeiten, sondern auf Zugänglichkeit
Keiner der sechs Dimensionen von OpenClaw - Dauerhaftes Online-Sein, Heartbeat-Mechanismus, externe Gedächtnisverwaltung, Skill (Fähigkeitspaket), Browser-Kontrolle, Fernaufruf von Knoten - ist neu. AutoGPT und verschiedene Browser-Agenten haben bereits in dieser Richtung experimentiert. Aber OpenClaw hat diese Elemente zusammengeführt und so eine qualitative Veränderung herbeigeführt.
Was es wirklich zum Durchbruch gebracht hat, sind zwei einfachere Dinge: die Integration von IM (Echtzeitnachrichten) und die 7x24-Stunden-Aktivität.
Cowork ist in Bezug auf die Fähigkeiten fast vollständig mit OpenClaw vergleichbar und in einigen Aspekten sogar überlegen. Das dreistufige Produktssystem von Anthropic - Claude Code Command Line, Cowork Desktop-Anwendung, Computer Use (Computerbedienung) + Dispatch (Verteilung) für die Fernsteuerung über verschiedene Geräte - ist technisch gesehen viel präziser als OpenClaw. Computer Use hat auf der OSWorld-Basis die menschliche Leistung erreicht (72,5 % gegenüber 72,4 % der Menschen). Aber es fehlen ihm zwei Dinge.
IM ermöglicht es dem Agenten, in der Ihnen vertrautesten Benutzeroberfläche auf Sie zu warten. Die 7x24-Stunden-Aktivität lässt ihn aufwachen und sich umsehen, ohne dass Sie etwas sagen müssen. Zusammen machen diese beiden Faktoren, dass der Agent nicht mehr auf Ihre Anfrage wartet, sondern kommt spontan zu Ihnen.
OpenClaw erklärt den Benutzern nicht, was ein Kontextfenster oder eine Sucherweiterung ist, sondern sagt einfach: "Ich bin immer online, ich merke mir, was Sie sagen, und ich erledige die Aufgabe selbst." Diese einfache Herangehensweise hat die technischen Barrieren direkt durchbrochen. 22 % der Mitarbeiter haben OpenClaw heimlich installiert, ohne dass die IT-Abteilung davon wusste.
Zugänglichkeit übertrumpft Fähigkeiten. OpenClaw, das technisch weniger leistungsfähig als Cowork ist, hat die Aufmerksamkeit der Benutzer gewonnen, weil es in der richtigen Benutzeroberfläche, zu dem richtigen Zeitpunkt und in der richtigen Art und Weise vor den Benutzern aufgetaucht ist.
Fünf verschiedene Wege erscheinen gleichzeitig, OpenClaw ist nicht der einzige
Bei den automatisierten Produkten, die gleichzeitig mit OpenClaw entwickelt wurden, können wir fünf Wege erkennen.
Hinter diesen Produkten stehen zwei Bedingungen, die gleichzeitig erfüllt sind.
Erstens, die Modelle haben endlich die Schwelle der "nachhaltigen Ausführung" überschritten. Die aktuellen Modelle machen immer noch Fehler, aber sie können zumindest in einem Kreislauf von mehreren Dutzend Schritten halten und vergessen nicht, was sie tun sollen. Dieser Unterschied ist entscheidend - lokale Fehler können durch Systemstützen korrigiert werden, globale Kollaps ist jedoch unheilbar.
Zweitens, die Harness-Engineering-Methodik ist stabil genug. Das Gedächtnis ist von einer schwarzen Kasten-Vektordatbank in reine Textdateien umgewandelt worden, die vom Benutzer direkt gelesen und bearbeitet werden können und die Git-Versionskontrolle unterstützen. Die Ausführungsumgebung verfügt über ein Gateway, einen Heartbeat-Mechanismus, Browser-Kontrolle und Fernaufruf von Knoten.
Die Kombination von Fähigkeiten und Stützstrukturen hat es langfristigen Agenten ermöglicht, zur gemeinsamen Wahl der gesamten Branche zu werden. Die Worktree-Architektur von Codex App ermöglicht es mehreren Agenten, parallel in demselben Code-Repository zu arbeiten. Fünf parallele Worktrees reduzieren die Bearbeitungszeit für eine 42-minütige Aufgabe auf 14 Minuten, ohne Merge-Konflikte.
Nach der Codierung ist der zweite dringende Anwendungsfall etabliert
OpenClaw in Kombination mit dem Skill-Markt hat den Agenten von einem Entwicklertool zu einem universellen Arbeitsassistenten gemacht, der alle Arten von Aufgaben wie Recherchen, Überwachungen, Inhaltserstellung und Kundenservice übernehmen kann. 13.700 Skills decken weitaus mehr Szenarien ab als die Codierung.
Das Muster ist klar: Solange es Skills gibt, die das Branchenwissen standardisieren, sind alle langfristigen, hochkognitiven Aufgaben für Agenten geeignet. Kurze, niedrigkognitive Aufgaben hingegen sind es nicht - Sie können in 30 Sekunden mit Ihrem Smartphone eine Milchshake bestellen, während ein Agent dies langsamer macht.
Walled Gardens können Agenten nicht aufhalten
In China konkurrieren neun große Unternehmen um die Einstiegspunkte, indem sie ihre eigenen IMs verbinden. Der Streit geht um die Frage, "in welchem App sollte der Agent integriert werden", und um die Kontrolle über die Ökosystemeinstiegspunkte. Aber gegen Ende des ersten Quartals beginnt diese Mauer zu brechen. QClaw unterstützt Feishu und DingTalk, und OpenClaw-CN ist mit fünf großen IMs kompatibel.
Wenn ein Agent gleichzeitig Kundennachrichten in WeChat, Teamkooperationen in Feishu und Genehmigungsverfahren in DingTalk verwalten muss, kann er nicht in einem einzigen IM "eingesperrt" bleiben. Je dringender der Bedarf an Agenten ist, desto größer ist der Druck für die Plattformübergreifende Nutzung, und desto weniger halten die Walled Gardens stand. Heute geht es darum, "wer dem Benutzer am nächsten ist", morgen wird es darum gehen, "wer es Agenten ermöglicht, überall nahtlos zu arbeiten".
Die Vorgehensweise in Silicon Valley unterscheidet sich stark von der in China. In Silicon Valley wird der Konflikt zwischen "Modellanbietern und Zwischenschichten" ausgetragen - Google hat Mitte Februar plötzlich und ohne Vorwarnung Hunderte von bezahlten Benutzern gesperrt, die OpenClaw zur Nutzung von Gemini verwendet haben. Der offizielle Grund war "schädliche Nutzung, die die Rechenlast weit über das erwartete Maß steigerte", aber in Wirklichkeit überprüft der Heartbeat-Mechanismus von OpenClaw alle 30 Minuten den vollständigen Kontext mit Tausenden von Token. Der tatsächliche Verbrauch eines einzelnen Ultra-Abonnementbenutzers kann in API-Preisen auf 1.000 - 3.600 US-Dollar pro Monat belaufen, weit über dem monatlichen Abonnementpreis von 250 US-Dollar. Dies ist ein direkter Angriff auf das Abonnement-Geschäftsmodell.
Anthropic hat diese Praxis als "Token-Arbitrage" bezeichnet und verlangt, dass Benutzer über API-Schlüssel zugreifen (der Preis ist 5 -