GPT-5 kann gewöhnliche Menschen zu Doktoren machen, aber Magie gibt es dennoch nicht.
Nach langem Warten ist GPT-5 endlich gestern Nacht um 1 Uhr auf den Markt gekommen. Auf der eine Stunde und 10 Minuten dauernden Pressekonferenz hat OpenAI der Welt ein großes Modell präsentiert, das absolut leistungsstark, noch einfacher zu bedienen ist und sogar in der Lage ist, die echten Absichten der Benutzer zu verstehen oder genauer zu erraten und ein Produkt zu liefern, das den Erwartungen entspricht.
Wie Sam Altman auf der Pressekonferenz sagte, kann GPT-5 auf allen Gebieten das Wissensniveau eines Doktors erreichen. Seine Fähigkeiten können mit denen von Fachleuten konkurrieren, sodass gewöhnliche Menschen Aufgaben erledigen können, die sie sich früher nicht vorstellen konnten.
Im Vergleich zur Zeit, als OpenAI vor zwei Jahren GPT-4 veröffentlichte, ist die Welt inzwischen viel besser mit großen Modellen vertraut und hat mehr Erfahrungen damit gesammelt. Zuschauer und Benutzer staunen nicht mehr darüber, dass das Modell Internet-Meme-Bilder verstehen kann. Aber als jemand, der fast täglich AI-Produkte nutzt, finde ich die Veröffentlichung von GPT-5 dennoch beeindruckend.
Der wichtigste Grund ist, dass ich aus den Inhalten der Pressekonferenz deutlich spüren kann, dass OpenAI will, dass das große Modell von einem "Spielzeug", das mit Sprache und "Intelligenz" spielt und ab und zu Überraschungen und Frustrationen bereitet, zu einem zuverlässigen Helfer im Alltag wird. Genau wie dein Handy: Wenn du es nicht hast, wirst du stark daran merken, wie unbequem, ungewohnt und sogar unsicher es ist.
Im Folgenden werde ich einige Momente der Pressekonferenz nutzen, um zu erklären, wie all das passiert ist.
Wenn dein Kind dich bittet, die Bernoulli-Formel in der Strömungsmechanik zu erklären, hätte ein früherer AI vielleicht einen Artikel gegeben. GPT-5 kann dir dagegen auf Anfrage direkt eine interaktive Seite in einem Satz erstellen.
Wenn du Französisch lernen willst, kann GPT-5 auf Anfrage eine Lernanwendung wie Duolingo erstellen. Du kannst damit Vokabeln lernen und auch über das Spiel "Schlange" wiederholen. Wenn du mit der erstellten Anwendung nicht zufrieden bist, kannst du GPT-5 auch direkt über natürliche Sprache bitten, sie zu ändern.
Wenn du der CFO eines Startup-Unternehmens bist, kannst du GPT-5 bitten, in etwa drei Minuten anhand aller deiner Daten eine detaillierte, interaktive Präsentation deiner finanziellen Situation zu erstellen. Alles, was du brauchst, ist eine Beschreibung von etwa 100 Wörtern. GPT-5 kann Code von Grund auf neu erstellen und die Aufgabe sicherlich erfüllen. Es kann erraten, wie du die Präsentation haben möchtest und automatisch den Code und das Präsentationsergebnis optimieren.
Das Verblüffendste ist, dass die Mitarbeiter von OpenAI in der Demonstration direkt mit drei Hinweisen GPT-5 dazu gebracht haben, ein 3D-Modell eines Schlosses mit einem kleinen Schießspiel zu erstellen. Man kann auch mit den Soldaten auf dem Schloss chatten. Wenn du auf die umliegenden Luftballons klickst, kann man Munition abfeuern und die Luftballons zerplatzen lassen. Gleichzeitig ertönt auch ein Explosionsgeräusch.
Aus der Demonstration können wir erkennen, dass GPT-5 sich zu einem Alleskönner entwickelt hat, der direkt professionelle Produkte ausgibt.
Ehrlich gesagt hat mich am meisten die Einführung von OpenAI über die Fähigkeiten im Bereich Gesundheit und Medizin berührt. OpenAI hat eine Patientin eingeladen, die sich von drei Krebsarten erholt hat, und sie hat erzählt, wie GPT-5 ihr bei der Krebskampf geholfen hat.
Sie sagte, als sie das Diagnoseergebnis erhielt, hatte der Arzt ihr mehrere Behandlungsmethoden zur Auswahl angeboten. Erst nachdem sie GPT-5 konsultiert hatte, verstand sie wirklich ihre Situation. Nachdem sie ihre Situation ausführlich mit GPT-5 besprochen hatte, traf sie die für sie beste Entscheidung und gewann schließlich den Kampf gegen die Krankheit und bekam ein neues Leben. Sie kann sich nicht vorstellen, wie sie, ohne jegliches medizinisches Fachwissen, die Behandlungsmethoden und Entscheidungen des Arztes verstehen und schließlich überleben hätte, wenn es nicht für die professionellen Ratschläge von GPT-5 gegeben hätte.
Nach der Pressekonferenz spüre ich deutlich, dass die Technologie der großen Modelle in eine relativ stabile Entwicklungskurve eingetreten ist. Die Veröffentlichung von GPT-5 zeigt, dass OpenAI keine anderen "Magien" hat, um die Fähigkeiten des großen Modells sprunghaft zu verbessern. Die "Kaltkrieg" zwischen den AI-Riesen wird in Zukunft noch heftiger werden.
Leistungsbeschreibung
Modellsystem
GPT-5 ist kein einfaches Modell mehr, sondern ein Modellsystem:
• Ein automatischer Umschalter erkennt die Fragestellung.
• Einfache Fragen werden an die Chat-Version weitergeleitet (schnelle Antwort).
• Komplexe Fragen werden an die Inferenz-Version weitergeleitet (tieferes Denken).
Ein Kontextfenster von 256.000 Token, das Text- und Bildinput unterstützt sowie Funktionsaufrufe und strukturierte Ausgaben.
Als ich meine eigene ChatGPT öffnete, stellte ich fest, dass die Modellauswahl links oben standardmäßig auf "GPT-5" steht und in der Dropdown-Liste die Vorgängermodelle nicht mehr zu sehen sind. Wie Altman schon versprochen hatte - in der Zeit von GPT-5 wird es keine mühsame Modellauswahl mehr geben. Das Modell entscheidet selbst, ob der Benutzer in der aktuellen Situation eine schnelle Antwort oder tiefere Überlegungen und Inferenzen benötigt.
Codierung und Schreiben
OpenAI bezeichnet GPT-5 als "unser bisher leistungsstärkstes Codierungsmodell". Es zeichnet sich besonders bei der komplexen Frontend-Generierung und der Fehlersuche in großen Code-Bibliotheken aus. Es kann in der Regel mit nur einem Hinweis schöne und reaktionsschnelle Websites, Anwendungen und Spiele erstellen und dabei Kreativität auf elegante Weise umsetzen.
Außerdem nennt OpenAI GPT-5 "unser bisher leistungsstärkstes Schreibwerkzeug". Es kann fesselnde Texte mit literarischer Tiefe und Rhythmus schreiben. Es kann zuverlässiger mit unstrukturierten Schreibaufgaben umgehen, wie z. B. unrhythmischen Versen oder fließenden Freien Reimen, indem es Respekt vor der Form mit klarer Ausdrucksweise verbindet. Das bedeutet, dass ChatGPT Benutzern besser bei alltäglichen Aufgaben wie dem Entwurf und der Bearbeitung von Berichten, E-Mails, Notizen usw. helfen kann.
Wir haben auch kurz die Gedichtschreibfähigkeit des neuen Modells getestet. Mit dem Thema "Das erste Teegetränk im Herbst" war das Ergebnis tatsächlich natürlicher als bei GPT-4 (es hat weniger "AI-Geschmack").
Bewertung
Das Gesamtsmartlevel von GPT-5 hat sich deutlich verbessert. Dies zeigt sich in seinen Leistungen bei akademischen und manuellen Bewertungs-Tests, insbesondere in den Bereichen Mathematik, Codierung, visueller Wahrnehmung und Gesundheit.
Es hat in Mathematik (94,6 % bei der AIME 2025 ohne Werkzeugtest), realer Welt-Codierung (74,9 % bei SWE-bench Verified, 88 % bei Aider Polyglot), multimodaler Wahrnehmung (84,2 % bei MMMU) und Gesundheit (46,2 % bei HealthBench Hard) neue Höchststände erreicht - diese Verbesserungen werden im täglichen Gebrauch deutlich spürbar.
Dank der erweiterten Inferenzfähigkeiten von GPT-5 pro hat das Modell auch bei GPQA einen neuen Höchststand erreicht, mit 88,4 % bei Tests ohne Werkzeuge.
GPT-5 hat sich auf LMArean an der Spitze platziert.
Bei der Vorschau-Zugangsmöglichkeit von Intelligence Analysis hat GPT-5 ebenfalls den ersten Platz belegt.
Weniger Halluzinationen
Bei aktivierter Suche ist die Wahrscheinlichkeit, dass GPT-5 Tatsachenfehler macht, um etwa 45 % geringer als bei GPT-4o. Im "Denkmodus" ist diese Wahrscheinlichkeit um 80 % geringer als bei OpenAI o3.
Außer Tatsachenfehlern sagt die AI oft auch einfach Unfug. Zum Beispiel behauptet sie manchmal, etwas hätten sie erledigt, obwohl sie es nicht kann oder nicht berechtigt ist. GPT-5 verhält sich in Bezug auf solche "Täuschungen" besser und ehrlicher. Um dies zu testen, hat OpenAI alle Bilder aus den Hinweisen des multimodalen Benchmark-Tests CharXiv entfernt. Es stellte sich heraus, dass OpenAI o3 immer noch mit einer Wahrscheinlichkeit von 86,7 % zuverlässige Antworten auf nicht existierende Bilder gab, während diese Quote bei GPT-5 nur 9 % beträgt.
Effizienter und sparsamer
In OpenAIs Bewertung schneidet GPT-5 (mit Denkfähigkeit) besser ab als OpenAI o3. Bei Funktionen wie visueller Inferenz, Agenten-Codierung und der Lösung von wissenschaftlichen Problemen auf Graduierten-Niveau wird die Anzahl der ausgegebenen Token um 50 % bis 80 % reduziert.
Das heißt, GPT-5 schafft es mit weniger Denkzeit, mehr Wert zu schaffen.