Claude Code's Big Chess Move Met with Mockery of High Cost: OpenAI Strikes Back with Sneaky Plugin

Während die großen Unternehmen heftig um die Ökosysteme von Entwicklertools konkurrieren, bringt Anthropic auch häufig neue Tools auf den Markt.

Während die großen Unternehmen in der Branche um die Ecosysteme von Entwicklertools konkurrieren, bringt Anthropic auch immer wieder neue Tools auf den Markt.

Letzte Nacht (Beijing-Zeit) kündigte Anthropic an, in seinem Entwicklungstool Claude Code eine bahnbrechende Funktion namens "Computer Use" (Computernutzungsfähigkeit) einzuführen. Diese Funktion ist derzeit als Forschungsvorschau (research preview) auf der macOS-Plattform verfügbar und ermöglicht es Claude, direkt über die Befehlszeilenschnittstelle (CLI) den Benutzercomputer zu steuern, um einen vollständigen Zyklus von der Codeerstellung bis zur Anwendungsvalidierung zu realisieren.

Computer Use ist nun verfügbar

Traditionelle AI-Codetools, sei es GitHub Copilot oder die frühe Version von Claude Code, beschränken sich im Wesentlichen auf die "Codeerstellung". Entwickler müssen die Schritte des Kompilierens, Ausführens, Debuggens und Validierens manuell durchführen. Die Einführung der "Computer Use"-Funktion ändert diesen Prozess grundlegend.

Nach der technischen Beschreibung von Anthropic kann Computer Use alle Aufgaben erledigen, die normalerweise außerhalb des Terminals manuell erledigt werden müssen, beispielsweise:

Erstellung und Validierung von nativen Anwendungen: Bitten Sie Claude, eine macOS-Menüleistenanwendung zu erstellen. Claude schreibt Swift-Code, kompiliert und startet die Anwendung und validiert sie, indem er jedes Steuerelement einzeln anklickt, bevor Sie die Anwendung öffnen, um sicherzustellen, dass sie ordnungsgemäß funktioniert.
End-to-End-UI-Tests: Bitten Sie Claude, eine lokale Electron-Anwendung zu öffnen und sagen Sie ihm: "Testen Sie den Benutzerführungsprozess". Claude öffnet die Anwendung, klickt auf die Registrierungsschaltfläche und macht Screenshots jeder Schritt. Es ist keine Playwright-Konfiguration oder Testframework erforderlich.
Debuggen von visuellen und Layoutproblemen: Sagen Sie Claude: "Das Modalfenster wird in einem kleinen Fenster nicht vollständig angezeigt". Claude ändert die Fenstergröße, reproduziert das Problem, macht einen Screenshot, ändert das CSS und validiert die Reparatur. Claude sieht dasselbe Problem wie Sie.
Nur GUI-unterstützte Tools: Interagieren Sie mit Designtools, Hardwaresteuerplatten, iOS-Simulatoren oder proprietären Anwendungen ohne CLI oder API.

Dies bedeutet, dass Entwickler komplexe Prozesse, die zuvor die Zusammenarbeit mehrerer Tools wie IDE, Browser und Simulator erforderten, ohne den Terminal verlassen zu müssen, erledigen können. Wichtig ist auch, dass diese Fähigkeit nicht auf die CLI-Umgebung beschränkt ist, sondern alle Szenarien abdeckt, die eine GUI-Interaktion erfordern, beispielsweise:

Native macOS-Anwendungen (z. B. SwiftUI)
Electron-Desktopanwendungen
Proprietäre Software ohne CLI oder API
iOS-Simulatoren, Designtools usw.

Mit anderen Worten, Claude kann nicht nur "Code schreiben", sondern auch "den Computer bedienen".

Technische Umsetzung: Basierend auf Agent Loop und MCP

Technisch gesehen ist "Computer Use" kein einfaches Automatisierungsskript, sondern auf einem vollständigen Agentenausführungsrahmen aufgebaut.

Diese Funktion wird durch einen eingebauten MCP (Model Context Protocol)-Server namens computer-use realisiert. MCP ist ein Schnittstellenstandard, den Anthropic in den letzten Jahren stark vorangetrieben hat, um die Interaktion zwischen Modellen und externen Tools sowie Datenquellen zu vereinheitlichen.

In dieser Architektur fungiert Claude als Entscheidungskern (Modell), die CLI als Interaktionsschnittstelle, der MCP-Server als Toolscheduler und das lokale System als Ausführungsumgebung. Claude wählt automatisch den geeignetsten Ausführungsweg für die Aufgabe aus:

Dieser "schichtweise Entscheidungs"-Mechanismus ist im Wesentlichen eine Optimierung von Kosten und Effizienz: GUI-Operationen sind die allgemeinste, aber auch die langsamste und ungenaueste Methode und werden daher nur als Sicherheitsnetz verwendet.

Nach der Einführung der "computer-use"-Funktion ist die Art und Weise, wie Claude lokale Anwendungen aufruft, nicht völlig offen, sondern basiert auf einem Berechtigungssteuerungsmechanismus, der auf "Sitzungen" basiert. Das Hauptziel dieses Mechanismus ist es, die Automatisierungsfähigkeit zu verbessern und gleichzeitig sicherzustellen, dass der Benutzer klare und kontrollierbare Grenzen für den Systemzugriff hat.

Zunächst einmal bedeutet das Aktivieren des computer-use-Servers nicht, dass Claude direkt auf alle Anwendungen auf dem Benutzercomputer zugreifen kann. Das System wendet standardmäßig eine bedarfsabhängige Autorisierungsstrategie an: Erst wenn Claude während der Ausführung einer Aufgabe erstmals versucht, eine bestimmte Anwendung aufzurufen, wird der Autorisierungsanforderungsprozess ausgelöst.

Während dieses Prozesses wird im Terminal eine Meldung angezeigt, die dem Benutzer mehrere Schlüsselinformationen klar macht: Erstens, den Namen der spezifischen Anwendung, die Claude aktuell steuern möchte; zweitens, ob diese Operation zusätzliche Berechtigungsanforderungen umfasst, wie den Zugriff auf die Zwischenablage oder andere sensible Ressourcen; drittens, ob während der Ausführung der Aufgabe durch Claude andere laufende Anwendungen beeinträchtigt werden, wie z. B. versteckt oder vorübergehend nicht sichtbar gemacht werden.

Der Benutzer muss auf der Grundlage dieser Informationen entscheiden, ob er die Anforderung "erlaubt" oder "ablehnt". Diese Autorisierung ist streng auf die aktuelle Sitzung beschränkt - alle Genehmigungen sind nur während der aktuellen Sitzung gültig. Sobald die Sitzung endet, werden die zugehörigen Berechtigungen automatisch widerrufen und nicht dauerhaft gespeichert oder auf andere Sitzungen übertragen. Diese Gestaltung reduziert effektiv das Risiko der langfristigen Missbrauch von Berechtigungen.

Darüber hinaus unterstützt das System, wenn Claude gleichzeitig auf mehrere Anwendungen zugreifen muss, die Massenautorisierung durch den Benutzer, um die Belastung durch häufige Bestätigungen zu verringern. Diese Gestaltung ist besonders wichtig bei mehrstufigen Aufgaben oder komplexen Arbeitsabläufen und ermöglicht es, einen Ausgleich zwischen Effizienz und Sicherheit zu finden.

Die Reaktion der Community ist geteilt

In der Reddit-Community hat diese neue Funktion schnell intensive Diskussionen ausgelöst.

Interessanterweise zeigt die Stimmung der Benutzer eine deutliche Spaltung: Einerseits wird der technische Wert der Funktion anerkannt, andererseits wird über ihre praktische Anwendbarkeit stark beanstandet.

Einige Benutzer finden die Funktion "konzeptionell cool", aber unter den aktuellen Einschränkungen hat sie fast keine praktische Bedeutung.

Einige Kommentare sagen direkt, dass solche Veröffentlichungen "unzeitgemäß" erscheinen. In der Community hat sich sogar ein ironischer Konsens gebildet - "Cool, aber wer kümmert sich?" Die am besten bewerteten Kommentare kritisieren die Produktstrategie von Anthropic. Sie halten es für unangemessen, dass selbst die Grunderfahrung der bezahlenden Benutzer nicht gewährleistet ist, geschweige denn das Experiment mit dieser ressourcenintensiven neuen Funktion. Aus ihrer Sicht gibt es deutliche Abweichungen bei der Ressourcenallokation und der Prioritätensetzung.

Zugleich werden einige konkrete Probleme wiederholt erwähnt. Beispielsweise sind Windows- und Linux-Benutzer unzufrieden, dass die Funktion noch nicht für ihre Plattformen verfügbar ist. Sie halten die Mac-Priorität bei der Veröffentlichung für unfair, da damit die breitere Entwicklergemeinschaft ignoriert wird. Darüber hinaus sind diese Benutzer auch verwirrt über die Positionierung der verschiedenen Produktformen. Die in der Community weit verbreitete Erklärung lautet: "Cowork" ist eher ein Sandbox-Assistent für den Desktop, der für normale Aufgaben verwendet wird; "Computer Use" ist ein Befehlszeilentool für Entwickler, das tiefere Systemzugriffsmöglichkeiten bietet und hauptsächlich für codebezogene Arbeitsabläufe eingesetzt wird.

Einige Benutzer gehen auch auf die Kosten und das Geschäftsmodell ein.

Einige Benutzer weisen darauf hin, dass das aktuelle Preissystem im Wesentlichen "subventioniert" ist. Sobald das Einheitswirtschaftsmodell stabilisiert ist, wird sich die Preisstruktur wahrscheinlich erheblich ändern, beispielsweise durch strengere Tarife, niedrigere Nutzungslimits und teure Abonnements für schwere Benutzer (50 bis 100 US-Dollar pro Monat oder mehr). Der Grund für diese Einschätzung ist, dass normale Benutzer heute nur 20 US-Dollar pro Monat ausgeben müssen, um Aufgaben zu erledigen, die früher möglicherweise Tausende von US-Dollar an Auftragskosten verursacht hätten.

Unter dieser Logik kann die Gesamtausgabe trotz sinkender Modellinferenzkosten weiterhin steigen - denn die zunehmende Benutzerzahl, die längere Kontextlänge und die höhere Aufgabenkomplexität erhöhen ständig den gesamten Rechenleistungsbedarf. Daher ist es für einige Benutzer fast "unvermeidlich", dass entweder die Preise erhöht, die Kontingente eingeschränkt oder weitere Beschränkungen eingeführt werden.

Natürlich gibt es auch Stimmen, die die aktuellen Nutzungsschwierigkeiten auf eine direktere Weise ausdrücken. Ein Benutzer scherzt, dass er vielleicht eines Tages genug Token gespart hat, um diese Funktion zumindest einmal zu testen, ohne seinen gesamten Wochenkontingent aufzubrauchen.

OpenAI veröffentlicht am selben Tag ein neues Plugin und greift in das Claude-Ecosystem ein

Interessanterweise hat OpenAI auch gestern Nacht ein neues Plugin namens codex-plugin-cc veröffentlicht, das es Entwicklern ermöglicht, direkt in Claude Code Codex zur Codeüberprüfung, gegenläufigen Überprüfung und sogar zur vollständigen Übergabe von Aufgaben an Codex zu verwenden.

Von der Produktstrategie her ist dies nicht einfach eine Kompatibilität oder Anpassung, sondern eher eine "umgekehrte Infiltration": Claude Code hat bereits sein eigenes Pluginecosystem aufgebaut, und OpenAI hat sich entschieden, offiziell in das Ökosystem einzusteigen und Codex als "Zweitmeinungssystem" im Arbeitsablauf zu positionieren. Es übernimmt nicht direkt den Hauptprozess, sondern gibt an kritischen Punkten unabhängige Urteile ab, um eine gegenläufige Kooperationsbeziehung zu bilden.

Dieses Plugin (codex-plugin-cc) ist sehr sparsam gestaltet und bietet nur drei Arten von Befehlen, die jedoch die wichtigsten Risikopunkte im Entwicklungsprozess abdecken.

Der erste Befehl ist /codex:review, der für die standardmäßige schreibgeschützte Codeüberprüfung verwendet wird. Dieser Modus ändert den Code nicht und konzentriert sich auf die Erkennung von üblichen Problemen, wie Codequalität, strukturelle Mängel oder potenzielle Fehler.

Der zweite Befehl ist /codex:adversarial-review, eine besonders markante Funktion des Plugins. Es begnügt sich nicht mit einer oberflächlichen Prüfung, sondern hinterfragt aktiv die "versteckten Annahmen" in der bestehenden Implementierung, wie Randbedingungen, Berechtigungslogik oder Systemkopplungspunkte. Diese Art von Überprüfung ist besonders für risikoreiche Szenarien geeignet, wie Systemmigrationen, Anpassungen der Authentifizierungsmechanismen oder Änderungen an Infrastrukturskripten. Im Wesentlichen handelt es sich um einen "Belastungstest" der bestehenden Lösung mit einem anderen Modellgedanken.

Der dritte Befehl /codex:rescue geht noch einen Schritt weiter - er ermöglicht es Entwicklern, die Kontrolle direkt an Codex zu übergeben, wenn eine Aufgabe ins Stocken gerät, damit Codex die Aufgabe neu plant und ausführt.

Das neue Plugin von OpenAI hat auf X (ehemals Twitter) intensive Diskussionen unter den Benutzern ausgelöst. Ein Benutzer sagte: "Man kann Claude auch einfach sagen, Codex-Executor und tmux zu verwenden, um dasselbe Ergebnis zu erzielen. Warum also ein neues Plugin entwickeln?"

Aber Dominik Kundel, Mitglied des OpenAI Codex-Teams, antwortete unter diesem Kommentar, der Benutzer solle es einfach mal ausprobieren. Dominik's Unterton könnte sein: Wenn das so einfach geht, warum sollten wir dann ein neues Plugin entwickeln!

Einige Benutzer haben auch gefragt, was der Unterschied zwischen der Verwendung von Codex MCP und diesem neuen Plugin ist.

Dominik antwortete in den Kommentaren: "Codex MCP ist eine einfachere, aber auch funktionell eingeschränktere Schnittstelle. Das Plugin nutzt im Hintergrund den Codex-Anwendungsserver. Es verwendet dasselbe Protokoll wie die Codex-Anwendung und ermöglicht es daher, Funktionen le

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Claude Code hat gerade einen gewaltigen Schachzug gemacht, aber in einem Augenblick wurde es von der Masse verspottet, dass es "zu teuer sei". OpenAI nutzte die Gelegenheit, um ein besonders hinterhältiges Plugin herauszuschmeißen und direkt in die Hinterhand zu greifen.

Computer Use ist nun verfügbar

Technische Umsetzung: Basierend auf Agent Loop und MCP

Die Reaktion der Community ist geteilt

OpenAI veröffentlicht am selben Tag ein neues Plugin und greift in das Claude-Ecosystem ein