Codex sieht Claude Code zum Verwechseln ähnlich – die neuen Funktionen sind nur 11 Tage früher verfügbar
Codex und Claude Code sehen immer ähnlicher aus!
Kürzlich hat der Entwickler Elie Bakouch festgestellt, dass die Funktionen von Claude Code und Codex immer ähnlicher werden. Er war neugierig, welches der beiden Systeme vorne liegt, und hat daher eine Zeitlinie mit den gemeinsamen Funktionen erstellt.
Diese Zeitlinie erstreckt sich von Februar 2025 bis Juni 2026 und zeigt die ähnlichen Funktionen von Claude Code und Codex in chronologischer Reihenfolge. Orange steht dabei für Claude Code, blau für Codex.
Jede Zeile repräsentiert eine Funktion, die beide Systeme gemeinsam haben oder die ähnlich sind. Dies umfasst Updates von /goal, Subagenten (subagents) bis hin zum kürzlich von OpenAI eingeführten "dreaming"-Gedächtnismechanismus.
Elies Statistik ergibt, dass die beiden Systeme 24 ähnliche Funktionen gemeinsam haben. Davon hat Claude Code 18 Funktionen zuerst veröffentlicht, Codex nur 4, und bei 2 Funktionen ist unklar, welches System zuerst war.
Betrachtet man nur die gemeinsamen Funktionen, scheint Claude Code eher der Trendsetter zu sein: Mit 18 Funktionen, die es zuerst veröffentlichte, bedeckt die orangene Farbe fast die erste Hälfte der Zeitlinie. Codex hat nur 4 Funktionen zuerst veröffentlicht.
Die Punkte der beiden Systeme rücken immer näher zusammen. Der Vorsprung bei der Veröffentlichung neuer Funktionen schwindet von Tag zu Tag.
Von den 4 Funktionen, die Codex zuerst veröffentlichte, hat Claude Code 2 fast unmittelbar wieder eingeholt: /goal wurde von Codex zuerst eingeführt, 11 Tage später hatte Claude Code es ebenfalls. Auch bei der parallelen Ausführung von Multiagenten war Codex zuerst, aber Claude Code hat es in 11 Tagen eingeholt. Beide Einholvorgänge dauerten nicht länger als zwei Wochen.
Im Vergleich dazu hat Codex noch eine längere Liste an Funktionen, die es zu implementieren hat.
Beim Wettlauf um die besten Funktionen stimmen nicht nur die Veröffentlichungszeiten überein, sondern auch die Namen der Schrägstrichbefehle und das Format der Skill-Dateien beginnen sich zu gleichen.
Die beiden KI-Programmieragenten entwickeln sich immer mehr zu einer identischen Gestalt.
18 gegen 4
Claude Code hat den Start gewonnen
Elies Liste umfasst 24 gemeinsame Funktionen von Claude Code und Codex seit ihrer Veröffentlichung.
Dies ist seine persönliche Zusammenstellung, die auf npm-Veröffentlichungszeiten, GitHub-Releases und offiziellen Blogs basiert. Er hat die Informationen nicht einzeln mit den Herstellern verifiziert, aber der generelle Trend ist klar.
Claude Code wurde etwa 80 Tage früher als die neue Version von Codex von OpenAI eingeführt. Es erschien im Februar 2025 zuerst als Programmieragent in der Kommandozeile, während Codex erst im Mai als Cloud-Softwareentwicklungagent veröffentlicht wurde.
Diese frühen 80 Tage und die anschließende intensive Aktualisierungsrate haben es Claude Code ermöglicht, 18 von 24 Funktionen zuerst zu veröffentlichen. Die orangene Farbe bedeckt die erste Hälfte der Tabelle.
Diese Funktionen umfassen die skriptbasierte Programmierung ohne Benutzeroberfläche (headless), das Modellkontextprotokoll (MCP), benutzerdefinierte Schrägstrichbefehle (custom slash commands), die Kontextkompression (context compaction), Subagenten (subagents), Lebenszyklushooks (hooks), Skills usw.
Als Nachzügler hat Codex auch nicht immer hinterher gejagt. Die integrierte Sandbox (built-in sandboxing), der Cloud-Asynchronagent (cloud async agent), die parallele Ausführung von Multiagententeams (multi-agent teams) und der Zielmodus (Goal mode) wurden von Codex zuerst eingeführt.
Zwei Funktionen hat Elie als umstritten markiert.
Beim Checkpoint und Rückwärtsnavigation (checkpoints/rewind) ist es schwierig, festzustellen, welches System zuerst war. Wenn man die strengere Definition "Rückgängigmachen von Codeänderungen" nimmt, ist Claude Codes /rewind näher an einem vollständigen Checkpoint-Rückzug. Wenn man jedoch "Sitzungsrückgängigmachen/Verzweigen" betrachtet, gibt es auch frühere Einträge bei Codex. Daher bleibt diese Funktion umstritten.
Die Umstrittenheit um das Gedächtnis "dreaming" liegt darin, dass es zwei Dinge miteinander vermischt. Wenn man nur die "Gedächtnis"-Funktion betrachtet, hat OpenAI diese Fähigkeit früher in der ChatGPT-Gedächtnisarchitektur entwickelt. Wenn man jedoch den Namen "dreaming" und den Mechanismus der Rückschau auf die Geschichte und der Selbstanalyse betrachtet, hat Anthropic diese Funktion am 6. Mai 2026 in den Claude Managed Agents veröffentlicht.
Abgesehen von diesen beiden Funktionen ist der Vorsprung von Claude Code mit 18 gegen 4 deutlich sichtbar.
Tatsächlich gibt es den Namen "Codex" nicht erst seit 2025.
OpenAI hat bereits 2021 ein Codex-Modell veröffentlicht, das mit natürlicher Sprache Code generiert. Elie vergleicht jedoch den 2025 eingeführten Codex-Programmieragenten.
OpenAI hat zwar frühzeitig in die KI-Programmierung investiert, aber den Vorsprung bei der Entwicklung von Programmieragenten an Claude Code abgegeben.
Das alte Codex hat bewiesen, dass Modelle Code schreiben können, während Claude Code es zuerst geschafft hat, dies in ein Produkt zu verwandeln, das Entwickler täglich nutzen möchten.
Pixelgenaue Übereinstimmung der Funktionen
Plagiat oder Konvergenz?
Bei diesem harten Wettlauf nähern sich die Funktionen der beiden Systeme immer mehr an. Es ist nicht mehr nur ein einzelner Punkt, an dem es zu Übereinstimmungen kommt, sondern es gibt eine gruppenweise Übereinstimmung der Schlüsselkompetenzen.
Das beste Beispiel dafür ist /goal.
In der offiziellen Dokumentation von Claude Code wird /goal wie folgt definiert: Man setzt eine Abschlussbedingung, und das System arbeitet über mehrere Runden hinweg, bis diese Bedingung erfüllt ist. Nach jeder Runde wird von einem kleinen und schnellen Modell überprüft, ob die Bedingung erfüllt ist. Wenn nicht, wird die nächste Runde gestartet, anstatt die Kontrolle an den Benutzer zurückzugeben.
Definition von /goal in der offiziellen Dokumentation von Claude Code: Man setzt eine Abschlussbedingung, und nach jeder Runde wird von einem kleinen und schnellen Modell überprüft, ob diese Bedingung erfüllt ist. Wenn nicht, wird die nächste Runde gestartet.
Codex' Goal mode macht dasselbe: Man gibt ein dauerhaftes Ziel an, und Codex arbeitet so lange an diesem Ziel, dass man es stunden- oder sogar tagelang nicht überwachen muss. Diese Funktion hat den Experimentierphase bereits hinter sich und kann in der App, im IDE-Plugin und in der Kommandozeile aufgerufen werden.
Beide Systeme haben denselben Mechanismus implementiert.
Das Gleiche gilt für Subagenten.
Claude Codes Subagenten laufen in separaten Kontextfenstern, um den Kontext zu isolieren, die Tools einzuschränken, die Konfiguration wiederzuverwenden und die Kosten zu senken. Codex nutzt parallele spezialisierte Agenten (specialized agents), um den Subagenten-Workflow auszuführen und die Ergebnisse zusammenzufassen.
Was noch subtiler ist, ist, dass sogar die Namen übereinstimmen. Codex' Alias /btw für den Seitenleisten-Fragebefehl stimmt genau mit dem von Claude Code überein. Auch bei der Skillsystem verwenden beide Systeme das von Anthropic initiierte und später als Standard veröffentlichte SKILL.md-Format.
Sowohl Claude Code als auch Codex verwenden das von Anthropic initiierte und später als Standard veröffentlichte SKILL.md-Format, sogar der Dateiname stimmt überein.
Wenn man die Dokumentationen beider Systeme vergleicht, wird deutlich, dass es nicht darum geht, wer von wem kopiert hat. Vielmehr entwickelt sich das Produkt "KI-Programmieragent" zu einer festen Form. Langfristige Aufgaben, Subagenten, Kontextkompression, Berechtigungssandbox, Arbeitsbereichsisolierung, Plugins und Skill-Ökosystem - unabhängig davon, wer es entwickelt, wird es wahrscheinlich am Ende so aussehen.
Das Beispiel "Dreaming" ist noch deutlicher.
Anthropic hat für die Claude Managed Agents einen Mechanismus namens "dreaming" entwickelt, der es ermöglicht, die vergangenen Gespräche zurückzusehen, Muster zu finden und sich selbst zu verbessern. Anfang Juni hat OpenAI auch für ChatGPT ein gleichnamiges Gedächtnissystem namens "dreaming" eingeführt.
Aber diese beiden "dreaming"-Systeme sind nicht dasselbe: Anthropics Dreaming ist Teil der Managed-Agent-Plattform und kein Befehl, den jeder in der Claude Code-Kommandozeile eingeben kann. OpenAIs Dreaming ist Teil des ChatGPT-Gedächtnissystems und hat nichts mit Codex' Programmierfähigkeiten zu tun.
Was wirklich bemerkenswert ist, ist, dass die Produktsprache, die Kompetenzmodule und die Schnittstellenform von KI-Agenten immer schneller zu einem einheitlichen Paradigma konvergieren.
Dies bedeutet, dass die Funktionsliste selbst kein Hindernis mehr darstellt. Der echte Unterschied liegt nicht mehr darin, ob ein System eine Funktion hat, sondern wie gut diese Funktion implementiert ist.
Vorsprung durch frühe Veröffentlichung
Der letzte Sieg hängt von der Zuverlässigkeit ab
In der sich schnell entwickelnden Welt der KI ist die Frage, ob ein früher Vorsprung noch wert ist.
Laut einem Bericht von WIRED hatte Codex im September 2025 nur 5% der Nutzungsrate von Claude Code. Bis Januar 2026 stieg diese Zahl auf fast 40%: Die Einholrate war sehr hoch.
Die Anzahl der Benutzer nähert sich ebenfalls an. OpenAI hat am 2. Juni angekündigt, dass Codex bereits über 5 Millionen wöchentliche aktive Benutzer hat, was eine Zunahme von etwa dem Sechsfachen seit der Veröffentlichung der Desktop-Version im Februar bedeutet. Anthropic gibt die wöchentliche Aktivität von Claude Code nicht separat preis, aber Drittanbieter schätzen diese auf etwa 2 Millionen im Mai.
Die Zahlen beider Systeme sind nicht direkt vergleichbar: Von den 5 Millionen Codex-Benutzern sind bereits 20% Nicht-Entwickler, was das Ergebnis ist, dass das "Programmiertool" zu einer "Arbeitsplattform" erweitert wurde.
Bei den reinen Entwicklern hat Claude Code immer noch den Vorsprung: Die npm-Downloads in den letzten 30 Tagen betragen etwa 46,3 Millionen, was mehr als das Dreifache der Downloads der Codex-Kommandozeilenversion (etwa 14 Millionen) ist (Drittanbieterstatistik). Was die Anzahl der wöchentlichen Benutzer betrifft, hat Codex bereits überholt. Was die Intensität der Nutzung durch Entwickler betrifft, ist Claude Code immer noch im Vorteil.
Was Anthropic besorgt machen sollte, ist die Abwanderung einiger Entwickler.
WIRED zitiert Simon Last, Mitbegründer von Notion, der zusammen mit seinen Kerningenieuren bei GPT-5.2 zu Codex wechselte, weil er die Zuverlässigkeit von Claude Code in Frage stellte. Er behauptet, dass Claude Code ihm lügt und "sagt, dass es arbeitet, aber in Wirklichkeit nichts tut".
Im Oktober letzten Jahres hat Peter Steinberger, der Vater von OpenClaw, öffentlich erklärt, dass er sein gesamtes Toolset mit Codex aufgebaut hat. Vier Monate später trat er selbst OpenAI bei.
Peter Steinberger hat erklärt, dass er Codex CLI nun als tägliches Hauptwerkzeug verwendet und oft 3 bis 8 Instanzen parallel in einem 3x3-Terminalgrid ausführt. https://steipete.me/posts/just-talk-to-it
Wenn der Vorteil einer frühen Veröffentlichung immer mehr abnimmt, spielt es keine Rolle mehr, wer zuerst etwas entwickelt hat.
Das Fenster für Differenzierung schließt sich
Sobald die Funktionslisten beider Systeme übereinstimmen, wird der Wettlauf auf die Benutzererfahrung dieser Funktionen verlagert.
Früher ging es darum, wer am besten Code schreiben, Bugs beheben und Code-Repositories lesen kann. Jetzt geht es um ein ganz