GPT-5.2 ist da. Der erste "expertenklassige" AI hat sich erfolgreich rächend durchgesetzt, und die arbeitshungrigen Angestellten sind endlich gerettet.
Gerade jetzt hat OpenAI in der Nacht die Bühne erobert!
Die beeindruckende Veröffentlichung von GPT-5.2 hat das globale AI-Triumphbett erneut wechselte Besitzer.
Insgesamt drei Modelle gehen heute live:
· GPT‑5.2 Instant (Sofortversion)
· GPT‑5.2 Thinking (Denkversion)
· GPT‑5.2 Pro (Profiversion)
Als weltweit stärkstes allgemeines Modell ist GPT-5.2 speziell für die Lösung von "hochspezialisierten Wissensaufgaben" konzipiert, die einem Kopfzerbrechen bereiten.
In den von OpenAI veröffentlichten Benchmarks hat es fast alle Aspekte von Gemini 3 Pro übertroffen!
Im Vergleich zur vorherigen Generation hat GPT-5.2 in allgemeiner Intelligenz, Langtextverständnis, Agentenwerkzeugaufruf und visuellen Fähigkeiten eine umfassende Evolution ohne Schwachstellen erreicht:
SWE-Bench Pro: Ein beeindruckender Score von 55,6 %;
LMArena Code Arena: Nur hinter Claude Opus 4.5, fest auf dem zweiten Platz weltweit;
ARC-AGI-2: GPT-5.2 Pro hat mit einer absoluten Überzahl von 52,9 % die Spitze der Welt erreicht;
GDPval: Abdeckung von 44 Berufswissensgebieten, Leistung übertrifft direkt menschliche Branchenexperten.
Zusammengefasst: Kein anderes Modell ist derzeit besser geeignet, um komplexe reale Weltaufgaben von Anfang bis Ende (End-to-End) zu bewältigen.
Vollständige Bewertungsresultate
Außer stärkeren Fähigkeiten hat GPT-5.2 auch einen längeren Kontext und aktuelleres Wissen!
400.000 Kontextfenster: Leichtes Verarbeiten von Langtexten und komplexen Gesprächen;
Maximale Ausgabelänge von 128.000: Tiefe Langtextgenerierung ohne Unterbrechung;
Wissensbasis aktualisiert bis 31. August 2025: Zugang zu den neuesten Weltgeschehnissen;
Unterstützung von Inferences-Tokens: Spezialisierung auf komplexe Logik und mehrstufige Schlussfolgerungen.
Naturgemäß steigen auch die Preise, wenn die Leistung so stark zunimmt.
Im Vergleich zu GPT-5/5.1 sind die Ein- und Ausgabepreise von GPT-5.2 um ganze 40 % teurer!
Stärkere Schlussfolgerungsfähigkeiten, schnellere Geschwindigkeit und höhere Preise scheinen alles darauf hinzudeuten -
Diesmal hat OpenAI nicht nur die Modellgröße erweitert, sondern auch die dahinter liegenden Rechenleistungskosten haben vermutlich ein neues Niveau erreicht.
Diesmal ist es richtig professionell!
Vor einem Monat trat GPT-5.1 mit einem Image von "hoher Emotionalintelligenz und Intelligenz" auf die Bühne, nur um auf Google Gemini 3, einen starken Konkurrenten, zu stoßen.
Dieser Updatezeitpunkt fiel mit Medienberichten über einen "roten Alarm" im Inneren von OpenAI zusammen.
OpenAI-Manager haben jedoch den Medien mitgeteilt, dass GPT-5.2 nicht als Reaktion auf Gemini 3 gesehen werden sollte. Der CEO von OpenAI Applications sagte den Journalisten:
Wir haben den "roten Alarm" ausgerufen, um intern ein Signal zu senden, dass wir uns auf die wichtigen Dinge konzentrieren wollen. Dies ist eine gute Möglichkeit, Prioritäten und Nicht-Prioritäten festzulegen.
Insgesamt haben wir die für die Entwicklung von ChatGPT eingesetzten Ressourcen erhöht. Ich denke, das hat zur Veröffentlichung dieses Modells beigetragen, aber es ist nicht der einzige Grund für seine Veröffentlichung in dieser Woche.
Diesmal ist GPT-5.2 ein speziell auf Fachwissen ausgerichtetes AI-Modell, das man als "das beste Arbeitsmodell für Angestellte" bezeichnen könnte.
Der chinesische OpenAI-Forscher Yu Bai sagte: "Trotz der scheinbar kleinen Versionsnummer ist es ein großer Sprung in der Leistung."
Bei Aufgaben, die menschliche Experten 4 bis 8 Stunden benötigen, hat GPT-5.2 in menschlichen Bewertungen eine Erfolgsquote von 70,9 %.
GPT‑5.2 hat sich in vielen praktischen Aufgaben bewährt -
Erstellung von Tabellenkalkulationen, Präsentationen, Code, Bilderkennung, Verständnis von Langtexten, Verwendung von Werkzeugen und Bearbeitung komplexer mehrstufiger Projekte.
Einer früheren OpenAI-Studie zufolge kann ChatGPT Unternehmen im Durchschnitt 40 bis 60 Minuten pro Tag sparen, und schwere Nutzer behaupten, dass sie pro Woche über 10 Stunden sparen können.
Erweiterte Lektüre: OpenAIs neueste Studie enthüllt! Die Effizienz der besten 5 % steigt um das 16-fache, während Durchschnittsnutzer stillschweigend abgelöst werden
Letztendlich ist es am wichtigsten, dass AI "Fachaufgaben" bewältigen kann!
Schlag gegen menschliche Experten, Freude für Angestellte
Derzeit ist GPT‑5.2 Thinking das beste Modell für professionelle Anwendungen in der realen Welt.
Bei GDPval hat GPT‑5.2 Thinking einen neuen SOTA (State of the Art) erreicht und ist das erste Modell in der Geschichte, das die Leistung von menschlichen Experten übertrifft.
Nach der Einschätzung von menschlichen Experten hat GPT‑5.2 Thinking in 70,9 % der Fälle in GDPval-Wissensarbeitsaufgaben Spitzenbranchenexperten geschlagen oder mit ihnen gleichgestellt.
Bei der Bewältigung von GDPval-Aufgaben ist es 11-mal schneller als Experten und kostet weniger als 1 %.
Dies zeigt, dass GPT-5.2 in Kombination mit menschlicher Überwachung effektiv bei der Bewältigung von Fachaufgaben helfen kann.
Mit anderen Worten, ob es darum geht, einem Buchhalter bei der Zusammenstellung von Finanzberichten zu helfen, einem Produktmanager bei der Erstellung von Präsentationen zu unterstützen oder einem Programmierer als Hilfsmittel beim Schreiben von Code zu dienen, GPT-5.2 ist immer besser zurecht.
Bei GDPval muss das Modell definierte Aufgaben in 44 Berufen aus den neun Branchen mit dem größten Beitrag zum US-BIP bewältigen. Die Aufgaben erfordern die Bereitstellung von tatsächlichen Arbeitsergebnissen, wie z. B. Verkaufspräsentationen, Buchhaltungs-Tabellenkalkulationen, Notfallpflegepläne, Fertigungsdiagramme oder Kurzvideos.
In ChatGPT hat GPT‑5.2 Thinking neue Werkzeuge, die GPT‑5 Thinking nicht hat.
Darüber hinaus hat GPT-5.2 Thinking in internen Tests für die Tabellenkalkulationsmodellierung bei Junior-Investmentbankanalysten im Durchschnitt pro Aufgabe 9,3 % mehr Punkte als GPT‑5.1, von 59,1 % auf 68,4 % gestiegen.
Ein Vergleich zeigt, dass die von GPT‑5.2 Thinking erstellten Tabellenkalkulationen und Präsentationen in Bezug auf Komplexität und Format verbessert sind.
Wie unten gezeigt, kann GPT‑5.2 Thinking mit einem Satz eine hochkomplexe Tabelle generieren, was es fast zum "Personalplaner" macht.