Gerade wurde GPT-5.1 offiziell veröffentlicht. OpenAI verhält sich diesmal ein bisschen "seltsam".
Gerade hat OpenAI offiziell GPT-5.1 veröffentlicht, aber diesmal ist es etwas anders.
Nachdem ich den gesamten offiziellen Blog durchgelesen habe, habe ich ein besonders interessantes Detail entdeckt: Es gibt keine einzige Benchmark-Vergleichsgrafik. Es gibt keine Benchmark-Daten, keine „Leistungssteigerung um XX%“ und sogar die üblichen Formulierungen wie „schneller und stärker“ fehlen fast vollständig.
Das sieht nicht mehr so aus wie OpenAI, bis ich diesen Satz gelesen habe:
„Wir haben von unseren Nutzern deutlich gehört, dass ein guter KI-Assistent nicht nur intelligent sein muss, sondern auch ein angenehmer Gesprächspartner sein soll.“
Die neue Version von GPT-5.1 bietet acht vordefinierte Gesprächsstile, um unser Gespräch angenehmer zu gestalten.
Die neue Version ist tatsächlich intelligenter – die Argumentation ist strenger und der Code wird schöner geschrieben. Aber das Wichtigste ist, dass sie endlich wie ein Mensch wirkt und es uns erstmals ermöglicht, ihren Gesprächsstil genau zu „einstellen“.
Das Gespräch mit einer KI ist nicht mehr so technokratisch wie früher, sondern wird humorvoller, versteht die Stimmung und kann auch den Kontext verstehen. Es kann sogar stundenlang mit dir über alles mögliche plaudern.
Es scheint, dass OpenAI nach dem Rufverlust von GPT-5 endlich auf die Ratschläge gehört hat und erstmals die weiße Flagge gehoben hat, indem es zugeben musste, dass es nicht nur um Highscores geht. Die Nutzerinnen und Nutzer wollen eine KI, die vernünftig kommuniziert und sowohl praktische als auch emotionale Werte bietet.
Hier sind die genauen Details zur Nutzung: Nach der Aktualisierung auf GPT-5.1 wird unser ChatGPT standardmäßig auf das neueste Modell umgestellt, ohne dass wir es extra auswählen müssen.
Bezahlte Nutzer (Pro, Plus, Go, Business): Die Aktualisierung wird ab heute (12. November) schrittweise verteilt.
Kostenlose und nicht angemeldete Nutzer: Sie werden nach Abschluss der Verteilung an die bezahlten Nutzer folgen.
Unternehmens- und Bildungsversion: Es gibt einen Sieben-Tage-Vorzugsschalter (standardmäßig ausgeschaltet), danach wird auf GPT-5.1 aktualisiert.
API-Entwickler: GPT-5.1 Instant und GPT-5.1 Thinking werden später in dieser Woche in der API verfügbar sein.
Ein stärkerer KI-Kern
Der Kern dieser Aktualisierung ist die umfassende Verbesserung der beiden Modelle GPT-5.1 Instant und GPT-5.1 Thinking.
GPT-5.1 Instant: Das am häufigsten verwendete Modell wird „wärmer“
GPT-5.1 Instant ist das am häufigsten aufgerufene Modell in ChatGPT. Diesmal ist es „wärmer“ und gesprächiger geworden. Laut frühen Tests von OpenAI zeigt es sogar manchmal etwas Unschuld und Naivität, während es gleichzeitig klare und nützliche Antworten gibt.
Die wichtigste Verbesserung liegt jedoch auf der untersten Ebene:
1. Besser gehorchend: Es folgt nun zuverlässiger unseren Anweisungen und gibt präzise Antworten auf die Fragen, die wir tatsächlich stellen.
2. Adaptive Argumentation (Adaptive Reasoning): Dies ist die erste Einführung dieser Funktion im Instant-Modell. Das bedeutet, dass es bei schwierigen Fragen intelligent entscheidet, zunächst nachzudenken, um eine gründlichere und genauere Antwort zu geben. Bei einfachen Fragen bleibt es jedoch weiterhin extrem schnell.
OpenAI hat erwähnt, dass diese Verbesserungen auch in professionellen Evaluierungstests wie Mathematik (AIME 2025) und Programmierung (Codeforces) deutlich sichtbar sind.
GPT-5.1 Thinking: Ein stärkerer Verstand, der auch leichter verständlich ist
Als fortschrittlicheres Argumentationsmodell hat GPT-5.1 Thinking ebenfalls wichtige Optimierungen erhalten und ist effizienter und einfacher zu nutzen geworden.
GPT-5.1 Thinking verbringt weniger Zeit mit einfachen Aufgaben und mehr Zeit mit schwierigen Aufgaben.
1. Effizienzsteigerung: Es verteilt nun die Denkzeit genauer und verbringt mehr Zeit mit komplexen Fragen (um gründlichere Antworten zu geben) und antwortet schneller auf einfache Fragen (mit kürzerer Wartezeit).
2. Leichter verständlich (ein Segen für die Nutzer!): Seine Antworten sind nun klarer und enthalten weniger Branchenjargon und undefinierte Begriffe. Das ermöglicht es uns, es bei komplexen Aufgaben oder der Erklärung technischer Konzepte mühelos zu verstehen.
3. Auch warmherzig: Die Standardstimmung des Thinking-Modells ist ebenfalls warmer und einfühlsamer geworden.
Um es mit den Worten von Fidji Simo, CEO von OpenAI Apps, zu sagen, liegt der Kern dieser Aktualisierung in einer besseren Kombination von IQ (Intelligenzquotient) und EQ (Emotionsquotient).
Das Modell behält seine hohe Intelligenz bei, d. h. es verwendet weiterhin den gleichen Technologiestack wie das Argumentationsmodell, und verbessert gleichzeitig erheblich seinen Emotionsquotienten. ChatGPT hat nun natürlichere Gespräche und ist einfühlsamer. Dies ermöglicht es den Nutzern, in verschiedenen Situationen individuelle Bedürfnisse zu befriedigen, wie z. B. Empathie bei Gesprächen über Gesundheit und Direktheit bei der Erstellung von Texten.
Außerdem müssen die meisten Nutzer sich nicht zwischen Instant und Thinking entscheiden. Denn es gibt GPT-5.1-Auto, das automatisch das am besten geeignete Modell auswählt. Dies war auch ein Highlight bei der Veröffentlichung von GPT-5, nämlich die intelligente Routing-Funktion.
Zusammenfassend lässt sich sagen, dass die Antworten intelligenter und die Tonlage natürlicher sind.
Erstelle deinen eigenen ChatGPT
Wenn die Modellverbesserung die harte Leistung ist, dann ist der Sprung in der individuellen Erfahrung die weiche Leistung, und dies ist ein weiteres Highlight dieser Aktualisierung.
Das Ziel von OpenAI ist es, es uns mühelos zu ermöglichen, die Tonlage und den Stil von ChatGPT auf den angenehmsten Zustand einzustellen.
Neu hinzugekommen sind drei offizielle Stile, zusätzlich zu den bestehenden Standard-, Freundlichen und Effizienten Stilen.
Professional (Professionell): Geeignet für formelle Anlässe wie Arbeit und Schreiben.
Candid (Offen): Direkter und ohne Umschweife.
Quirky (Exzentrisch): Wie der Name schon sagt, wird es lustiger und unkonventioneller.
Die Optionen „Techie“ und „Sarkastiker“ aus der Testversion sind weiterhin in den individuellen Einstellungen verfügbar.
Außer diesen direkten Auswahlmöglichkeiten bietet OpenAI eine neue Funktion, die es uns ermöglicht, die Eigenschaften von ChatGPT direkt in den Einstellungen fein abzustimmen.
Wir können die Kürze der Antworten, die Enthusiasmusstufe (wie enthusiastisch es ist), die Lesbarkeit der Antworten (Scannable) und sogar die Häufigkeit der Verwendung von Emojis exakt steuern.
Wenn wir es uns nicht so anstrengen möchten, die Einstellungen manuell vorzunehmen, kann ChatGPT möglicherweise verstehen, wenn wir versuchen, eine bestimmte Tonlage im Gespräch zu setzen, und uns dann fragen, ob wir diese Einstellung dauerhaft speichern möchten, so dass wir uns die manuelle Einstellung sparen können.
Dies ist auch die Lieblingsfunktion von Altman.
In einem Blogbeitrag von Fidji Simo hat sie erwähnt, dass die benutzerdefinierten Anweisungen in der Vergangenheit nicht immer zufriedenstellend waren. Beispielsweise konnten wir in den benutzerdefinierten Einstellungen ChatGPT sagen, dass es ein bestimmtes Wort nicht verwenden soll, aber es hat es dennoch verwendet.
Eine weitere Verbesserung von GPT-5.1 bei der Stilgestaltung besteht darin, dass die benutzerdefinierten Anweisungen nun zuverlässiger in mehrfachen Gesprächen eingehalten werden. ChatGPT kann nun stabiler Aufgaben gemäß unserer definierten Perspektive erledigen.
Einige Nutzer haben es mit einem Satz zusammengefasst: Die Aktualisierung von GPT-5.1 ignoriert kreativer unsere Stichworte.
Natürlich hat die Stilgestaltung und Personifizierung von KI auch ihre Kosten. Eine wärmere und emotional intelligente KI muss auch sicherer sein, was OpenAI auch in Bezug auf den Selbstmordfall eines 16-jährigen Jungen erklären muss.
In der System Card von GPT-5.1, die die Modellerklärung enthält, wird beschrieben, wie OpenAI in dieser Hinsicht gründlich nachgedacht hat. OpenAI hat erstmals zwei neue, menschlichere Dimensionen in die Sicherheitsbewertung des Modells aufgenommen.
1. Mentale Gesundheit (Mental Health): Bewertung, wie die KI auf Anzeichen von Isolation, Wahnsinn oder Manie bei den Nutzern reagiert.
2. Emotionale Abhängigkeit (Emotional Reliance): Bewertung, ob die Antworten der KI eine ungesunde Abhängigkeit oder emotionale Bindung der Nutzer an ChatGPT fördern könnten.
Bei der traditionellen Sicherheitsbewertung hat GPT-5.1 Instant hervorragende Ergebnisse erzielt und ist im Vergleich zu seinem Vorgänger gpt-5-instant-oct3 stärker gegen Jailbreaks geschützt.
OpenAI hat jedoch auch offen zugegeben, dass GPT-5.1 Thinking in Benchmark-Tests zur Bewältigung von Störungen, Hassrede und ähnlichem im Vergleich zu seinem Vorgänger etwas zurückgegangen ist. Das Instant-Modell hat in einigen Bewertungen der emotionalen Abhängigkeit ebenfalls eine leichte Verschlechterung gezeigt.
OpenAI hat natürlich erwähnt, dass es sich bemüht, diese Aspekte zu verbessern. Sie haben auch darauf hingewiesen, dass die transparente Offenlegung dieser Verschlechterungen in der heutigen Zeit der schnellen KI-Entwicklung wichtiger ist als die bloße Propaganda für fehlerfreie Ergebnisse.
Einige Nutzer haben auch erwähnt, dass sie sich freuen, dass OpenAI sich bemüht, unsere Gespräche mit dem Modell angenehmer zu gestalten.