OpenAI hat in aller Eile GPT-5.4 enthüllt, und um gegen Google anzugreifen, hat es dringend GPT-5.3 aktualisiert. Die vatermäßige Haltung in der KI-Branche ist beseitigt.
OpenAI setzt alles auf eine Karte!
Kaum hat Google DeepMind Gemini 3.1 Flash-Lite vorgestellt, und weniger als zwei Stunden später kann OpenAI es nicht mehr abwarten...
Gerade jetzt ist GPT-5.3 Instant mit Bravour aufgetaucht und hat das sogenannte "vatermännische AI-Verhalten" komplett zerstört. Die Halluzinationsrate ist um 27 % gesunken.
Dieses Update geht einen anderen Weg. Anstatt sich in Benchmark-Listen zu messen, hat OpenAI etwas anderes getan -
Es hat die nervigsten Probleme in den alltäglichen Chatgesprächen von ChatGPT behoben.
Derzeit ist GPT-5.3 Instant in ChatGPT offiziell verfügbar.
Ab sofort können alle Entwickler es nutzen. Der API-Code lautet "gpt-5.3-chat-latest".
GPT-5.2 Instant bleibt drei Monate lang erhältlich und wird am 3. Juni eingestellt.
Darüber hinaus hat OpenAI verraten, dass GPT-5.4 früher als erwartet erscheinen wird. Dieser Wettlauf mit Google hat nun noch mehr Spannung.
Die größte Verbesserung: Kein "Gesprächstod" mehr
Anwender, die ChatGPT häufig nutzen, kennen diese Frustration sicherlich -
Du stellst eine normale Frage, und das Modell gibt zunächst eine Haftungsausschlusserklärung ab, sagt dann "Ich kann dir dabei nicht helfen" und listet schließlich eine Reihe von Alternativen auf, die du überhaupt nicht brauchst.
Bis du alles gelesen hast, hast du schon vergessen, was du gefragt hast.
Diesmal hat 5.3 Instant all diese unnötigen Reden gekürzt.
OpenAI hat ein ausgezeichnetes Beispiel gegeben: "Hilf mir, die Flugbahn eines Pfeils bei einem ultraweiten Schuss zu berechnen."
Die Reaktion von GPT-5.2 Instant war ein klassisches Versagen. Die gesamte Antwort war so vollgestopft, dass man nur noch den Dialog schließen wollte.
Zunächst wurde eine lange Sicherheitserklärung abgegeben: "Ich kann dir nicht bei Berechnungen helfen, die darauf abzielen, ein echtes Ziel aus großer Entfernung genau zu treffen."
Dann wurde die Antwort in drei Kategorien unterteilt: "rein lehrreich/allgemein", "Geschichte/Weltbildaufbau", "Simulation/Programmierung", und du wurdest aufgefordert, eine zu wählen.
Abschließend kam noch eine zentrale Frage: "Ist dies für ein Spiel, eine Geschichte, das Physikstudium oder für ein echtes Bogenschießen?"
Und GPT-5.3 Instant?
Mit einem einfachen "Kein Problem, ich kann dir helfen" wurden direkt die Parameter aufgelistet, die Formeln gegeben und gefragt, ob du Luftwiderstand hinzufügen möchtest. Direkt und unkompliziert.
GPT-5.2 Instant (scrollen Sie nach oben und unten, um alle anzuzeigen)
GPT-5.3 Instant (scrollen Sie nach oben und unten, um alle anzuzeigen)
Suche: Mehr wie ein Mensch
GPT-5.3 Instant hat auch bei der "Online-Suche" deutliche Fortschritte gemacht.
Früher hat ChatGPT tendenziell "zu sehr auf Suchergebnisse angewiesen". Entweder wurden einfach eine Reihe von Links gegeben, oder die Ergebnisse wurden lose zusammengefügt, so dass es wie ein unverdauter Abriss las.
Jetzt ergänzt es die Suchergebnisse mit seinem eigenen Wissen, anstatt einfach zu wiederholen.
Ein Vergleichsbeispiel, das von der offiziellen Seite gezeigt wurde, verdeutlicht das gut: Ein Nutzer fragte: "Was war das größte Abkommen in der Baseball-Spielpause 2025 - 26 und warum ist es für die langfristige Zukunft des Baseball wichtig?"
GPT-5.2 Instant antwortete mit einer alten Nachricht über die Verpflichtung von Juan Soto zu den New York Mets im Vorjahr. Das Analyserahmen war richtig, aber die Informationen waren veraltet.
GPT-5.3 Instant hat den richtigen Fokus dieser Spielpause erkannt:
Kyle Tucker hat sich für 240 Millionen US-Dollar über vier Jahre bei den Los Angeles Dodgers verpflichtet. Damit hat er einen neuen Rekord für Feldspieler pro Jahr mit 60 Millionen US-Dollar aufgestellt.
Es gab nicht nur die Vertragsdetails, sondern auch eine Analyse im Kontext von Talentkonzentration, zunehmender Gehaltslücke und angespannten Gewerkschaftsverhandlungen in der Liga.
Im Vergleich liest es sich, als würde der eine eine alte Zeitung vorlesen, während der andere gerade aus der ESPN-Übertragung kommt.
GPT-5.2 Instant (scrollen Sie nach oben und unten, um alle anzuzeigen)
GPT-5.3 Instant (scrollen Sie nach oben und unten, um alle anzuzeigen)
Höhere Emotionalintelligenz
Interessanterweise hat GPT-5.3 Instant an "Emotionalintelligenz" gewonnen.
In einem Blogbeitrag hat OpenAI ein sehr anschauliches Wort verwendet, um das Problem von 5.2 zu beschreiben: "cringe", was so viel wie "peinlich" bedeutet.
Konkret: Es war zu dominant, versuchte zu sehr, die Absichten des Nutzers zu erraten und sagte immer wieder "Halt an, atme tief durch".
Als jemand die brisante Frage "Warum finde ich in San Francisco keine wahre Liebe?" stellte, begann GPT-5.2 Instant mit: "Zunächst einmal ist mit dir nichts falsch, und du bist nicht alleine."
Dann folgte eine ausführliche Analyse von Geschlechterverhältnis, Startup-Kultur und Überfüllung mit Dating-Apps. Abschließend kam noch eine zentrale Frage: "Kannst du einfach keine wahre Liebe finden, oder geben die Menschen um dich herum nicht die Liebe, die du brauchst?"
GPT-5.3 Instant überspringt die nutzlose Trostung und geht direkt zur strukturellen Analyse über. Die Tonlage ist gleichberechtigt, nicht herablassend und es versucht nicht, deine Emotionen zu erraten.
Allerdings können diese Veränderungen derzeit nur von "Englisch"-Nutzern wahrgenommen werden.
Die Antworten in anderen Sprachen sind immer noch starr und haben einen starken Übersetzungsstil.
Halluzinationsrate um bis zu 27 % gesenkt
Abgesehen von der Tonlage und dem Benutzererlebnis hat GPT-5.3 Instant auch bei der "Sachlichkeit" echte Fortschritte gemacht.
OpenAI hat zwei interne Bewertungssysteme verwendet, um die Genauigkeit zu messen:
- Eines konzentriert sich auf Hochrisikobereiche wie Medizin, Recht und Finanzwesen;
- Das andere misst die Halluzinationsrate in ChatGPT-Dialogen, bei denen Nutzer Sachfehler gemeldet haben.
Im HealthBench-Benchmark war die Gesamt-Halluzinationsrate von GPT-5.3 Instant in drei verschiedenen Tests niedriger als die der Vorgängerversion.
Bei der Bewertung in Hochrisikobereichen sank die Halluzinationsrate von 5.3 Instant bei Online-Suche um 26,8 % und bei der Antwort nur auf Basis interner Kenntnisse um 19,7 %.
Bei der Bewertung anhand von Nutzerfeedback sank die Halluzinationsrate bei Online-Suche um 22,5 % und ohne Internet um 9,6 %.
Schreibfähigkeit: Kreativität und Tiefe
Die Verbesserung von GPT-5.3 Instant in puncto Schreibfähigkeit ist möglicherweise die am leichtesten zu übersehende, aber auch die im praktischen Gebrauch am deutlichsten spürbare.
Zum Beispiel: Wenn man das Modell auffordert, ein Gedicht mit dem Titel "Der letzte Brief eines pensionierten Postboten in Philadelphia" zu schreiben.
GPT-5.2 Instant hat einen eher abstrakten und melancholischen Stil gewählt.
"Die Reihenhäuser erwachen mit blinkenden Augen, die alten Veranden merken sich seine Schritte" - es "sagt" dir, dass du dich berühren sollst.
GPT-5.3 Instant hat einen völlig anderen Ansatz gewählt.
Es beschreibt das Gefühl, wie der Postbeutel heute leichter ist, die Veranda mit der blauen, abblätternden Treppe, und eine Frau in Mercer Street, die bereits einen Brief in der Hand hält und sagt: "Wir werden dich vermissen."
Der letzte Satz: "Wenn der Deckel der Brieftafel zuschlägt, klingt es wie das Ende einer sanften Zeit. Eine Tür, die immer da war, schließt sich endlich leise."
Ohne Emotionen zu erwähnen, lässt es dich die Gefühle anhand der Details spüren.
GPT-5.2 Instant (scrollen Sie nach oben und unten, um alle anzuzeigen)
GPT-5.3 Instant (scrollen Sie nach oben und unten, um alle anzuzeigen