Sind die Spiny Crayfish endgültig aus dem Trend? Ein Team der Tsinghua-Universität hat in aller Eile ein Agent-Werkzeug open source gemacht, wodurch die Token-Kosten um 70 % gesenkt wurden.
Hat die Hummerwelle abgeklungen?
OpenClaw, das Anfang 2026 in ganz China ein Riesenhit war, hat sich abgekühlt.
Freunde, die einst OpenClaw rund um die Uhr modifizierten, haben es in die Kälte geschickt. Dieses Projekt, das in rekordverdächtiger Zeit auf GitHub berühmt wurde, hat heute fast keine Medienpräsenz mehr.
Der kleine Hummer hat möglicherweise seine historische Mission erfüllt – wie ein Hurrikan hat er erstmals das Agenten - Paradigma in die breite Öffentlichkeit gebracht und allen gezeigt, dass KI nicht nur ein Chatbot zum Plaudern ist, sondern auch aktiv Aufgaben für Sie erledigen kann.
Aber es konnte kein Linux werden. Weil es zu schnell vorangeschritten ist, hat es nicht genug Zeit gehabt, eine ausreichend tiefe Codebarriere und Ökosystem aufzubauen und wurde daher am Rande gelassen.
Also, welche trendigen neuen Tools nutzen jetzt diejenigen, die wirklich von Agenten für die Produktivität profitieren möchten?
Kürzlich wurde im Kreis ein intelligentes Betriebssystem namens PilotDeck diskret eingeführt.
Diese Technologie wurde von der THUNLP - Labor der Tsinghua - Universität, Mianbi Intelligence, OpenBMB und AI9stars gemeinsam entwickelt und als Open - Source - Projekt veröffentlicht.
Wenn OpenClaw ein "großes Spielzeug" des Geek - Romantismus ist, dann ist dieser "Elite - Student aus Tsinghua" ein echter "intelligenter Agenten - Kooperationsraum" für reine Produktivität, der den Hummer am Rande lassen kann.
Von der Milchteebar bis zum Daten - Dashboard: Ein unglaublich großer Sprung
Was unterscheidet es von den oberflächlichen ersten Generationen von Agenten? Lassen Sie uns einige sehr anschauliche Tests ansehen.
Wir haben gleichzeitig zwei Workspaces eröffnet, einer für Spieleentwicklung und einer für Datenvisualisierung. Wir wollen sehen, ob es beiden gewachsen ist.
Im ersten Workspace haben wir einen Satz von Anweisungen eingegeben.
"Entwickeln Sie ein Simulationsspiel für eine Milchteebar. Es soll ein Einkaufssystem, ein Preissystem und ein Wartesystem geben. Die Kunden entscheiden, ob sie kaufen, basierend auf Preis und Ruf."
Nach der Eingabe des Prompts hat es einen sehr detaillierten Plan für das Milchtee - Simulationsspiel erstellt.
PilotDeck hat den Kernzyklus des Spielentwurfs aufgeteilt, fünf Sorten Milchtee entwickelt und auch das Einkaufssystem, das Preissystem, das Kunden - und Wartesystem, das Finanzsystem usw. selbst entworfen.
Bei der technischen Umsetzung hat es im Voraus das UI - Layout im frischen Kartenstil geplant und die wichtigen JS - Module und Implementierungsschritte geschrieben.
Schließlich kann man das Milchtee - Spiel online testen!
Der zweite Workspace hat eine völlig andere Richtung.
"Hier ist eine Gruppe von Finanzierungsdaten globaler KI - Unternehmen. Bitte erstellen Sie ein interaktives Daten - Dashboard mit Animationseffekten. Beim Überfahren mit der Maus sollen Details angezeigt werden."
Bei dieser Aufgabe hat PilotDeck mit vier Diagrammen die Top 10 der Gesamtfinanzierung, die Finanzierungsanteile in Nordamerika, Europa und Asien, die Verteilung der Branchen von genereller KI, Unternehmens - KI und generativer KI usw. gezeigt.
Das schließlich erstellte Daten - Dashboard zeigt die Finanzierungsdaten der KI - Unternehmen in verschiedenen Regionen sehr klar.
Die beiden Aufgaben laufen gleichzeitig. Einer schreibt die Spiellogik, der andere zeichnet Diagramme. Sie stören sich nicht gegenseitig.
Nachdem die beiden Aufgaben abgeschlossen waren, haben wir noch eine weitere Aufgabe hinzugefügt, die nur für Spaß war.
"Entwickeln Sie einen Persönlichkeitstest für Programmierer mit 10 Fragen. Der Test soll ermitteln, welche Art von Programmierer - Persönlichkeit Sie haben. Es soll eine Ergebnisseite und eine Teilen - Karte geben."
PilotDeck hat 10 Multiple - Choice - Fragen erstellt, die sehr nah an realen Entwicklungsumgebungen sind, und hat die Persönlichkeiten in Architekt 🏛️, Bauarbeiter 🧱, Perfektionist ✨, Magier 🧙, Prediger 📣 und Philosoph 🤔 unterteilt.
Der visuelle Stil ist das dunkle GitHub - Thema und die gleichbreite Schriftart JetBrains Mono, was einen hohen Tech - Faktor hat.
Nachdem ich die 10 Fragen beantwortet habe, hat sich herausgestellt, dass ich tatsächlich ein Bauarbeiter bin.
Von Simulationsspielen bis zu Daten - Dashboards bis zu sozialen Mini - Anwendungen: Der Sprung ist unglaublich groß.
Aber in PilotDeck ist jeder ein unabhängiger Workspace, der seine eigene Aufgabe erledigt.
Während andere nur Ordner isolieren, isoliert es die ganze Welt
Nachdem die Aufgaben abgeschlossen waren, haben wir etwas Interessanteres getan: Wir haben die Memory - Panels der beiden Projekte geöffnet.
Im Gedächtnis des Milchtee - Bar - Projekts sind die Spiellogik, der UI - Stil und die Spielparameter gespeichert.
Im Gedächtnis des Daten - Dashboard - Projekts sind die Diagrammtypen, die Farbschemata und die Datenverarbeitungslogik gespeichert.
Es gibt keine Überlappung der Gedächtnisse zwischen den beiden Projekten.
Dies ist der grundlegende Unterschied zwischen PilotDecks Workspaces und denen anderer Anbieter.
Obwohl Claude Cowork Projekte zur Isolation einführt und Cursor auch Workspaces hat, ist ihre Isolation im Wesentlichen "Ordner + Regeln". Das Gedächtnis ist unsichtbar und unveränderbar, die Fähigkeiten entwickeln sich nicht mit der Nutzung weiter, und es ist schwierig, die Kosten für jedes Projekt zu trennen.
PilotDeck erstellt für jedes Projekt eine vollständige "Arbeitskabine", die drei Ebenen hat.
· Exklusives Dateisystem: Es ist klar, welche Dateien zu diesem Projekt gehören und was die KI generiert hat.
· Exklusives Gedächtnis: Das Projektgedächtnis speichert die Projektdefinition und den Fortschritt, das Kollaborationsfeedback speichert Ihre Präferenzen. Alles ist sichtbar, veränderbar und der Herkunft nach verfolgbar.
· Exklusive Fähigkeiten: Skill - Anwendungen können mit einem Klick aus dem App - Store in den entsprechenden Workspace installiert werden. Beispielsweise kann man für die Spiele - Arbeitskabine einen Game - Asset - Finder und für die Dokumenten - Arbeitskabine ein minimax - PDF - Tool installieren.
Die Workspaces anderer Anbieter sind Ordner mit statischen Regeln. PilotDecks Workspace ist eine vollständige Lebensumgebung für KI.
Token - Rechnung halbiert, Effekt unverändert
Es ist ein offenes Geheimnis bei Agenten - Tools, dass sie zwar sehr praktisch sind, aber die Rechnung sehr hoch ausfallen kann.
Wenn man den stärksten Modell für alle Aufgaben nutzt, kostet die Token - Nutzung sogar mehr als ein Taxifahrt.
Viele Menschen wählen die Strategie, manuell zwischen Modellen zu wechseln: billige Modelle für einfache Probleme und teure Modelle für komplexe Probleme. Aber der Wechselaufwand ist selbst sehr lästig.
PilotDeck hat ein intelligentes Routing - System entwickelt, und seine Vorgehensweise unterscheidet sich von den Lösungen auf dem Markt.
Zuerst mal die wichtigste Designentscheidung.
Die meisten Routing - Lösungen arbeiten auf Request - Ebene. Bei jeder Anfrage wird entschieden, welches Modell verwendet werden soll.
Das Problem dabei ist, dass häufige Modellwechsel den KV - Cache unterbrechen, was bedeutet, dass jedes Mal, wenn das Modell gewechselt wird, die Daten neu geladen werden müssen, und die Inference - Effizienz sinkt.
PilotDecks Routing wird auf der Ebene der Sub - Agenten durchgeführt.
Nachdem eine komplexe Aufgabe in mehrere Teilaufgaben aufgeteilt wurde, wird der gesamte Sub - Agent einem Modell zugewiesen, und der Kontext - Cache innerhalb des Sub - Agenten bleibt kontinuierlich.
Es spart nicht nur Token - Kosten, sondern auch die Leistungseinbußen durch häufige Wechsel.
Dann kommen die Scheduling - Regeln.
Im Vergleich zu festgelegten Routing - Lösungen wie "teure Modelle für schwere Aufgaben, billige Modelle für einfache Aufgaben" ist PilotDeck viel flexibler.
Es unterstützt die Einstellung der Routing - Strategie über Regeln und Prompts. Sie können selbst definieren, welche Art von Aufgaben welches Modell nutzen soll. Sie können sogar in natürlicher Sprache sagen: "Alle Code - verwandten Teilaufgaben sollen mit Claude Opus bearbeitet werden, Textverarbeitung mit billigen Modellen."
Wenn Sie das Routing - Panel öffnen, können Sie sehen, welche Schwierigkeitsstufe (komplex / einfach / mittel) jeder Session zugewiesen wurde, wie viel tatsächlich gekostet hat und wie viel es ohne Routing gekostet hätte.
Beispielsweise in unseren Tests konnten wir sehen, dass bei der Programmierer - Persönlichkeitstest - Anwendung ohne Routing 10,97 US - Dollar verbraucht wurden, aber mit Routing nur 1,42 US - Dollar, was einer Einsparung von 75 % (9,55 US - Dollar) entspricht.
Das Forschungsteam hat diesen Effekt auch in größeren Tests bestätigt.
Im Szenario der Social - Media - Inhaltsgenerierung (Xiaohongshu) betrug der Verbrauch mit Routing 2,83 US - Dollar, ohne Routing 12,58 US - Dollar, was einer Einsparung von ca. 70 % entspricht.
Im Szenario komplexer Aufgaben (Podcast - Mehrsprachigkeit, Finanzanalyse, Code - Dokumentation usw.) kostete die Kombination von Sonnet 4.6 als Hauptmodell und MiniMax - M2.7 als Sub - Modell 3,15 US - Dollar und erreichte einen Score von 70,6. Das einzelne Sonnet 4.6 kostete 18,36 US - Dollar und erreichte einen Score von 69,1. Obwohl es nur 1/6 des Preises kostet, ist der Effekt sogar etwas besser.
Wenn Sie nur den besten Effekt erzielen möchten, können Sie das Routing einfach deaktivieren und das stärkste Modell für alle Aufgaben nutzen. Die Wahl liegt bei Ihnen.
Außerdem hat das Routing - System noch weitere Funktionen.
PilotDeck kann lokal installierte Modelle als Sub - Agenten nutzen, so dass sensible Daten nicht