Silicon Valley: Zwei "Waffen" in einer Nacht - GPT-5.3-Codex gegen Claude 4.6 bringt Altman ins Schwitzen

ChatGPT hat sich selbst erschaffen.

Innerhalb eines Tages haben zwei große Programmier-AIs Silicon Valley heimgesucht. Nach Claude Opus 4.6 hat Altman in Eile GPT-5.3-Codex herausgebracht. Der Kampf um den Thron der KI hat damit endgültig begonnen.

Silicon Valley wird heute Nacht keinen Schlaf finden!

Claude Opus 4.6 hat in der tiefen Nacht unerwartet attackiert, und Altman war völlig überrascht.

Als Reaktion darauf hat OpenAI in Eile geantwortet und binnen weniger als einer halben Stunde das stärkste intelligente Programmier-Modell – GPT-5.3-Codex – präsentiert.

Es gibt kein GPT-5.3, nur GPT-5.3-Codex!

Es vereint perfekt die Spitzen-Programmierfähigkeiten von GPT-5.2-Codex mit den hervorragenden logischen und fachlichen Fähigkeiten von GPT-5.2, und die Laufzeit ist um 25 % verbessert.

Es kann problemlos lange Aufgaben bewältigen, die tiefe Recherchen, Tool-Einsätze und komplexe Ausführungen erfordern.

GPT-5.3-Codex ist wie ein Kollege, mit dem man zusammenarbeitet. Man kann es während seiner Arbeit in Echtzeit leiten und interagieren, ohne befürchten zu müssen, dass der Kontext verloren geht.

Es ist erwähnenswert, dass GPT-5.3-Codex das erste Modell ist, das bei seiner eigenen Entstehung eine Schlüsselrolle gespielt hat.

Mit der Veröffentlichung von GPT-5.3-Codex hat sich die Rolle von Codex grundlegend gewandelt:

Es hat sich von einem AI-Intelligent-Agenten, der nur Code schreiben und überprüfen kann, zu einem Agenten entwickelt, der fast alles tun kann, was Entwickler und Fachleute auf einem Computer tun können.

GPT-5.3-Codex ist jetzt in das ChatGPT-Premium-Abo aufgenommen und deckt alle Anwendungsfälle von Codex ab: App, CLI, IDE-Erweiterung und Web-Browser.

Jetzt ist ganz Silicon Valley zum Schlachtfeld zwischen Anthropic und OpenAI geworden, und die Luft ist voller Pulvergeruch.

Interessanterweise hatte Altman ursprünglich um Mitternacht die Veröffentlichung eines neuen Modells angekündigt, aber Anthropic hat die Nase vorn gehabt.

Über Nacht haben sich die beiden stärksten Programmier-AIs direkt gegenüber gestellt, und die Netizens haben sich beschwert: "Es ist einfach unmöglich, mit der Geschwindigkeit der AI-Entwicklung Schritt zu halten".

Der Auftritt von GPT-5.3-Codex: Stärker in der Codierung

Wie stark GPT-5.3-Codex wirklich ist, zeigt sich an seinen Leistungsdaten.

Neuer SOTA in der Software-Engineering

GPT-5.3-Codex hat in der SWE-Bench Pro-Evaluierung, die die reale Software-Engineering misst, einen neuen Branchenrekord aufgestellt.

Gleichzeitig hat es in der Terminal-Bench 2.0, die die Endgeräte-Fähigkeiten von Programmier-Agenten misst, eine deutlich bessere Leistung als der bisherige SOTA gezeigt.

Es ist erwähnenswert, dass GPT-5.3-Codex für all dies viel weniger Token verbraucht als alle bisherigen Modelle.

Im Vergleich zu SWE-bench Verified, das nur Python testet, deckt SWE-Bench Pro vier Sprachen ab. Es ist nicht nur resistenter gegen Datenschmutz, sondern auch herausfordernder, vielfältiger und branchenrelevanter.

Spiele aus dem Nichts erschaffen

Dank seiner fortschrittlichen Programmierfähigkeiten und Verbesserungen in der Ästhetik und Kompaktheit kann GPT-5.3-Codex erstaunliche Ergebnisse erzielen. Es kann sogar innerhalb weniger Tage hochkomplexe Spiele und Anwendungen von Grund auf aufbauen.

Um die Web-Entwicklungs- und Langzeit-Intelligent-Agenten-Fähigkeiten des Modells zu testen, hat OpenAI GPT-5.3-Codex zwei Spiele programmieren lassen:

Die zweite Version des Rennspiels, das bei der Veröffentlichung der Codex App vorgestellt wurde, und ein Tauchspiel.

Mit seinen Fähigkeiten in der Web-Spieleentwicklung und vordefinierten allgemeinen Folgeaufforderungen (z. B. "Behebe Bugs" oder "Verbessere das Spiel") hat GPT-5.3-Codex in Millionen von Token-Interaktionen die Spiele selbstständig weiterentwickelt.

Rennspiel: Es gibt verschiedene Rennfahrer, acht Karten und sogar Items, die mit der Leertaste ausgelöst werden können.

Tauchspiel: Die Spieler können Korallenriffe erkunden, Korallen sammeln, um ihr Fischbuch zu vervollständigen, und gleichzeitig ihren Sauerstoff verwalten.

· Es versteht deine Absichten besser

Im Vergleich zu GPT-5.2-Codex kann GPT-5.3-Codex deine Absichten genauer verstehen, wenn du es anweisen, eine alltägliche Website zu erstellen.

Für einfache oder unklare Aufforderungen erstellt es jetzt standardmäßig Websites mit mehr Funktionen und besseren Einstellungen, die als gute Grundlage für deine Kreativität dienen.

· GPT-5.3-Codex vs. GPT-5.2-Codex

Nehmen wir als Beispiel an, dass man sowohl GPT-5.3-Codex als auch GPT-5.2-Codex anweisen würde, eine Landingpage zu erstellen.

GPT-5.3-Codex würde automatisch die Jahrespläne als monatliche Preise anzeigen, so dass die Rabatte klar und gut gestaltet erscheinen, anstatt einfach die Jahresgesamtsumme zu berechnen.

Außerdem würde es eine automatische Testimonial-Slideshow mit drei verschiedenen Benutzeraussagen erstellen, anstatt nur eine monotone Aussage anzuzeigen. Dadurch würde die Seite standardmäßig vollständiger aussehen und eher wie ein Produkt, das direkt online gehen kann.

GPT-5.3-Codex

GPT-5.2-Codex

Aufforderung:

Erstelle eine Landingpage für Quiet KPI, ein wöchentlicher Indikator-Summary, der für Gründer freundlich ist. Verwende einen sanften SaaS-Stil mit Glas-Karten, einem Farbverlauf von Lavendel bis Blau und einem leichten Unschärfeeffekt. Die Abschnitte sollten sein: Ein Anfangsbildschirm mit E-Mail-Sammlung, ein Raster von Beispielberichtskarten, eine Liste von Integrationen, eine Testimonial-Slideshow, eine Umschaltung zwischen monatlichen und jährlichen Preisen, eine FAQ und ein Footer.

· Verwende die Schriftart Satoshi oder eine ähnliche geometrische Sans-Serif-Schriftart.

· Verwende abgerundete Buttons mit einem Radius von 14px und einen starken Fokus-Effekt.

· Füge einen stilvollen Scroll-Effekt hinzu.

Allgemeine Fähigkeiten über die Programmierung hinaus

Softwareingenieure, Designer, Produktmanager und Datenwissenschaftler machen viel mehr als nur Code schreiben.

GPT-5.3-Codex unterstützt alle Phasen des Software-Lebenszyklus, wie Debugging, Deployment, Überwachung, Schreiben von PRDs, Textbearbeitung, Benutzerforschung, Tests und Metriken.

Außerdem kann es dem Benutzer helfen, alles zu erstellen, was er will – sei es ein ansprechendes Präsentationsdeck oder eine komplexe Datenanalyse in einer Tabelle.

In der GDPval, die die Leistung in fachlichen Aufgaben misst, hat GPT-5.3-Codex eine hervorragende Leistung gezeigt und sich auf dem gleichen Spitzenniveau wie GPT-5.2 befunden.

1. Präsentationsdeck für Finanzberatung

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

In Silicon Valley, zwei "Waffen" wurden binnen einer Nacht ins Feld geführt. GPT-5.3-Codex setzt sich gegen Claude 4.6, und Altman wird wirklich nervös.

Der Auftritt von GPT-5.3-Codex: Stärker in der Codierung

Neuer SOTA in der Software-Engineering

Spiele aus dem Nichts erschaffen

Allgemeine Fähigkeiten über die Programmierung hinaus