Nach GPT-5: Sind wir der AGI näher gekommen oder weiter entfernt?
Am 15. März 2023 wurde GPT-4 veröffentlicht. Damals versuchten die meisten Menschen noch herauszufinden, wie man ChatGPT überhaupt benutzt und wo die offizielle Website ist. Ich habe mich nur oberflächlich mit GPT-3.5 auseinandergesetzt, ein bisschen mit ChatBox gespielt und ein paar alberne Fragen gestellt, bis ich nicht mehr wusste, was ich noch fragen sollte.
Deshalb erinnere ich mich noch immer deutlich an das Gefühl nach dem ersten ernsten Gespräch mit GPT-4. Im Kopf kreiste nur ein Gedanke: Die Welt hat sich verändert.
Im Internet damaliger Zeit herrschte eine Atmosphäre wie in der Goldrushzeit, eine Mischung aus Aufregung und Unsicherheit. Jeder hat unglaubliche Screenshots wild umhergeschickt und darüber diskutiert, welche Berufe bald verschwinden würden. Wir dachten wirklich, dass das das Wunder an sich sei.
Niemand hatte gedacht, dass dies nur der Prolog einer langen Nacht war.
Nach 939 Tagen harter Wartezeit hat OpenAI am frühen Morgen des 8. August 2025 (Beijing-Zeit) endlich die GPT-5 vorgestellt. Die Welt hielt den Atem an und erwartete ein weiteres "Wunder, das die Welt verändert".
Als die Vorhang aufgegangen ist, sahen wir jedoch eine Show, die viel komplexer, widersprüchlicher, unaussprechlicher und unverständlicher war, als wir uns vorgestellt hatten. So ist es in diesem Jahr bei OpenAI üblich: Normale Benutzer sind voller Lob, die tägliche aktive Benutzerzahl (DAU) steigt stetig; während die Hardcore-Benutzer lautstark beschweren. Ich selbst habe schon mehrere Male den Hauptmodell gewechselt, von GPT zu Claude und Gemini, und benutze ChatGPT schon lange nicht mehr. Seit der beeindruckenden Frühjahrs-Pressekonferenz von GPT-4o im vergangenen Jahr hat jede Pressekonferenz von OpenAI ein Bitter-süßes Gefühl hinterlassen, die Hype waren größer als die Überraschungen.
· · ·
Zu Beginn der Pressekonferenz hat Sam Altman die Richtung mit einem pragmatischen Ton festgelegt: "GPT-3 ist wie ein Highschool-Schüler, GPT-4o wie ein Student, und GPT-5 ist wie ein Team von Doktoren, das jederzeit auf Anfrage reagieren kann." Das Schlüsselwort ist nicht mehr "chatten", sondern "handeln".
Der Kern, um dies zu erreichen, ist keine einfache Anhäufung von Parametern, sondern eine philosophische Revolution in der Architektur.
In der Vergangenheit mussten Benutzer sich schmerzlich zwischen der Geschwindigkeit von GPT-4o und der tiefen logischen Fähigkeit von GPT-3 entscheiden, wie jemand, der sich in einem Waffenlager voller verschiedener Waffen nicht entscheiden kann. GPT-5 versucht, dieses "Entscheidungsproblem" zu beenden.
Es ist ein einheitliches Intelligenssystem. Darin befindet sich ein schnelles Modell (gpt-5-main), das die meisten Probleme löst, ein Modell für tiefe logische Fähigkeit (gpt-5-thinking), das für schwierige Probleme entwickelt wurde, und eine der wichtigsten Komponenten - der Echtzeit-Router (real-time router). Dieser Router fungiert wie ein erfahrener Projektmanager, der je nach Art und Schwierigkeit Ihrer Frage, sogar nach Ihrem Befehl "überlege dir das mal richtig", entscheidet, welcher "Experte" mobilisiert werden soll.
Die Nutzung von GPT-5 über die API ist einfacher: Es bietet drei Modelle - regulär (regular), klein (mini) und nano (nano), und jedes Modell kann in einem von vier logischen Stufen laufen: minimal (eine neue Stufe, die in anderen OpenAI-Modellen noch nicht existiert), niedrig, mittel oder hoch.
Die Eingabebeschränkung dieser Modelle beträgt 272.000 Token, die Ausgabebeschränkung (einschließlich unsichtbarer logischer Token) 128.000 Token. Sie unterstützen Text und Bilder als Eingabe, nur Text als Ausgabe.
Die OpenAI-Forscherin Tina Kim hat auch auf der Pressekonferenz gesagt: "Mit GPT-5 werden wir alle alten Modelle abschaffen." Dies ist eher eine Erklärung als eine Überheblichkeit. Die Zeit des "Modellzoo", der die Benutzer verwirrt hat, ist vorbei. Stattdessen gibt es nun einen hochkooperativen Intelligenzorganismus mit einheitlicher Absicht.
Die GPT-5 System Card zeigt die Vererbungsbeziehung zwischen alten und neuen Modellen.
Jeder neue König muss ein großartiges "Muskelshow" geben, um seine Macht zu beweisen. GPT-5 hat in verschiedenen Benchmark-Tests fast alle Rekorde gebrochen.
Aber genau in diesem üblichen Benchmark-Test, bei dem man Daten präsentiert, ist es fehlgeschlagen.
Aufmerksame Internetnutzer haben festgestellt, dass die Säulendiagramme auf den PPTs in den ersten fünf Minuten der Pressekonferenz "ziemlich willkürlich" gezeichnet waren. Beispielsweise war in einem Diagramm die Säule für 69,1% kürzer als die für 52,8%.
Dieses kleine Zwischenspiel, zusammen mit Musk's sofortigen Weiterleitung auf X (früher Twitter) der "Glückwünsche" "Grok 4 hat GPT-5 in ARC-AGI-2 geschlagen", bilden einen interessanten Anmerkung.
Benchmark-Tests sind am Ende doch kalt. Der echte Unterschied zeigt sich in der lebendigen und heißen praktischen Erfahrung.
Das ist genau der Kern von GPT-5, das faszinierendste und zugleich beunruhigendste. Es bietet nicht allen Schaffenden die gleichen Chancen, sondern trifft klare Entscheidungen.
Zunächst die Multimodularität. Audioeingabe/-ausgabe und Bildgenerierung gehören derzeit nicht zu den Fähigkeiten von GPT-5. Diese Funktionen werden weiterhin von Modellen wie GPT-4o Audio, GPT-4o Realtime und ihren Mini-Versionen sowie GPT Image 1 und DALL-E für Bildgenerierung abgedeckt.
Vielleicht gibt es bald GPT-5o, wer weiß.
Dann das AI-Programmieren, was für Entwickler am wichtigsten ist. Dieses Jahr ist ein glückliches Jahr für Entwickler. Am gleichen Tag wie die Veröffentlichung von GPT-5 wurde auch Cursor CLI veröffentlicht, und alle Arten von Coding Agenten sind in diesem Jahr explodiert.
Die Demonstration auf der Pressekonferenz war beeindruckend: Innerhalb von nur zwei Minuten hat GPT-5 auf die Anfrage "Baue eine Web-App für mein Partner, um Französisch zu lernen" eine vollständige interaktive Website erstellt, die Karteikarten, Tests und sogar ein "Maus-essen-Käse"-Snake-Spiel enthält.
Die wichtigere Prüfung liegt in der genauen Änderungsfähigkeit von produktionsreifem Code. In einem anderen Test hat ein Entwickler die KI gebeten, in einem komplexen Produktionsprojekt bestimmte Eigenschaften (props) in einer.ts-Datei zu ändern und alle Dateien, die diese Komponente referenzieren, zu aktualisieren. Dies ist eine mühsame Aufgabe, die leicht zu Fehlern führt und viele Abhängigkeiten hat.
Das Ergebnis war, dass Gemini 2.5 Pro und Claude 4 Opus "vollständig gescheitert" sind. GPT-5 hingegen hat die Aufgabe perfekt gelöst. Es ist nicht mehr nur ein Werkzeug, das Code "schreibt", sondern beginnt, das Projekt zu "verstehen" und wie ein echter erfahrener Kollege zu denken.
Michael Truell, CEO des AI-Programmier-Startups Cursor, wurde zu einer Demonstration auf der Pressekonferenz eingeladen. Er hat GPT-5 aufgefordert, ein Problem zu lösen, das seit drei Wochen auf GitHub im OpenAI Python SDK offen lag. GPT-5 hat schnell einen Plan erstellt, das Code-Repository durchsucht, das Problem lokalisiert und die Änderungen vorgenommen, alles in einem reibungslosen Prozess. Truell hat kommentiert: "Dies ist das erste Mal, dass ich einem Modell vertraue, um meine wichtigsten Aufgaben zu erledigen."
Um diese "vertrauenswürdige" Fähigkeit wirklich zu verbreiten und als Grundlage für die Entwickler-Ökosystem zu machen, ist eine revolutionäre Geschäftstrategie unerlässlich. Hier sprechen wir zunächst über die API-Preise von GPT-5, die eine Marktkatastrophe darstellen. Nur 1,25 US-Dollar pro Million eingegebener Token, halb so viel wie bei GPT-4o und sogar konkurrenzfähiger als die gleichwertigen Modelle von Google und Anthropic. Dahinter steckt eine klare strategische Absicht: Profit für Marktanteil, niedrige Preise für Ökosystem.
Zitiert aus dem neuesten Artikel von Simon Willison
Der Preisvergleich bringt mich an das GPT-4.5 dieses Jahres, das als OpenAIs Misserfolg galt und später zu GPT-4.1 verdichtet wurde (dies inverse Naming-Schema finde ich immer noch absurd).
Damals betrug der Preis noch nicht 8 US-Dollar pro Million ausgegebener Token wie bei GPT-4.1 auf dem Bild, sondern 180 US-Dollar, was als ein Höchstpreis galt. Es war eigentlich das Ergebnis eines fehlgeschlagenen Pre-Trainings von GPT-5, mit dem internen Code-Namen "orion". Es wurde genau zu einer Zeit veröffentlicht, als DeepSeek-R1 seine Preise senkte, und wurde daher von vielen ausgelacht.
Aber dieser teure Preis hat dieses Modell zu einem der stärksten Schreibmodelle in den Augen vieler Benutzer gemacht. In der offiziellen Propaganda damals wurde GPT-4.5 auch für seine Fähigkeit zur emotionalen logischen Fähigkeit und das reale menschliche Erlebnis beworben.
Das Schreiben von Texten ist derzeit die umstrittene Fähigkeit von GPT-5. GPT-5, ein intelligentes Gemisch, das es ermöglicht, das Modell selbst auszuwählen, scheint kein Modell zu haben, das mit der Schreibfähigkeit von GPT-4.5, das auf Emotionen spezialisiert ist, konkurrieren kann:
Sam Altman selbst hat einen Tweet gepostet und mit dem schwarzen Humor eines "Leichenpredigt für GPT-4o" bewiesen, dass die Schreibfähigkeit von GPT-5 stark verbessert wurde:
Aber in den Kommentaren unter seinem Tweet gibt es auch Leute, die sagen, dass die Schreibfähigkeit von GPT-5 enttäuschend ist.
Wir erwähnen das Programmieren und