StartseiteArtikel

Veröffentlichung von OpenAI GPT-5: Das Modell übertrifft alle anderen in jeder Hinsicht – Der erste Schritt zur Schaffung einer „Superintelligenz“

极客公园2025-08-08 09:19
OpenAI hat erstmals den State-of-the-Art (SOTA) erreicht, aber sie sagen, dass dies nur der erste Schritt beim Aufbau der „Superintelligenz“ ist.

Nach unzähligen Verzögerungen ist endlich GPT-5 da.

Um 1 Uhr morgens am 8. August (Beijing-Zeit) hat die OpenAI Sommer-Presskonferenz, die wie eine neue Generation der "Technologie-Jahresüberschau" wirkt, begonnen.

Im Gegensatz zu den vorherigen schnellen Presskonferenzen von OpenAI hat OpenAI dieses Mal eine über eine Stunde lange Live-Presskonferenz vorbereitet. Mehrere Teams haben nacheinander aufgetreten und die beeindruckenden Fähigkeiten von GPT-5 aus verschiedenen Perspektiven gezeigt.

Zunächst die wichtigsten Punkte: GPT-5 hat in mehreren Bereichen eine umfassende Verbesserung erzielt. Es führt in den Bereichen Textverarbeitung, Webentwicklung und visueller Wahrnehmung an; es führt auch in Bereichen wie Hard-Prompts, Codierung, Mathematik, Kreativität und Langsuchanfragen an. Im Test mit dem Code-Namen "Summit" hat GPT-5 bisher die höchste Arena-Punktzahl und ist so wörtlich "Spitzenreiter" geworden.

Sam Altman hat gesagt, dass GPT-4o wie ein Schüler in der Mittelschule sei, während GPT-5 wie ein Student sei. Er hat sogar GPT-5 mit dem ersten iPhone mit Retina-Display verglichen: "Wenn Sie GPT-4o eine Frage stellen, erhalten Sie vielleicht die richtige Antwort, vielleicht auch etwas Verrücktes. GPT-4 fühlt sich an wie ein Gespräch mit einem Studenten. GPT-5 hingegen ist das erste Mal, dass ich wirklich das Gefühl habe, mit einem Expert auf Doktor-Niveau zu sprechen." So hat Sam Altman die Verbesserung der Fähigkeiten von GPT-5 beschrieben.

Obwohl die wöchentlichen aktiven Nutzer von ChatGPT fast 700 Millionen erreicht haben, hat OpenAI in der vergangenen Zeit tatsächlich kein branchenführendes Modell gehabt. Jetzt glaubt OpenAI, dass GPT-5 es wieder sicher an die Spitze der Rangliste bringen wird.

Altman hat sogar direkt auf der Presskonferenz behauptet: "Dies ist das Modell mit der stärksten Codierungsfähigkeit der Welt, das Modell mit der besten Schreibfähigkeit der Welt und auch das stärkste Modell im Bereich Gesundheitswesen der Welt"

Zugleich hat OpenAI auf der Presskonferenz auch erklärt, dass GPT-5 nicht nur eine hervorragende Codierungsfähigkeit hat, sondern auch in der Schreibkunst und der Genauigkeit bei der Beantwortung von gesundheitsbezogenen Fragen einen Schritt nach vorne gemacht hat. Gleichzeitig hat GPT-5 nicht nur einen "riesigen Sprung" in der Intelligenz gemacht, sondern auch das Problem der "lügenhaften Antworten" (Halluzinationen) stark reduziert. Es ist besser darin, Anweisungen zu verstehen und zu befolgen, und die Tendenz, sich zu schmeicheln, ist auch stark verringert.

01 Abschied von den "Halluzinationen", das AI wird zuverlässiger

Zunächst die Modellauswahl dieser Aktualisierung. Die GPT-5-Serie besteht aus insgesamt vier Versionen: GPT-5, mini, nano und chat. Die Chat-Version bietet eine noch natürlichere und intelligente Antworterfahrung - Sie können sogar damit eine neue Sprache lernen.

Außerdem werden Sie, wenn Sie jetzt die ChatGPT-Website öffnen, zunächst feststellen, dass GPT-5 als ein einzelnes Modell dargestellt wird, anstatt als ein normales Modell plus ein unabhängiges Inferenzmodell.

Hinter diesem liegt tatsächlich ein von OpenAI entwickeltes Routing-System (Router), das automatisch zu der Version mit stärkerer Inferenzfähigkeit wechselt, wenn die Abfrage komplexer ist, oder auch, wenn Sie es anweisen, nachzudenken. (Altman hat gesagt, dass die vorherige Modellauswahl-Oberfläche "ein totales Durcheinander" war.)

"AI-Halluzinationen" waren immer ein großes Problem, über das die Leute sich beschweren. Die gute Nachricht ist, dass OpenAI bei GPT-5 große Anstrengungen unternommen hat, und die offizielle Aussage lautet, dass die Wahrscheinlichkeit von Halluzinationen "deutlich gesunken" ist. Genauer gesagt:

Beim Internet-Suchen ist die Wahrscheinlichkeit, dass GPT-5 Tatsachenfehler in seiner Antwort macht, 45 % niedriger als bei GPT-4o.

Beim eigenen Nachdenken ist die Fehlerwahrscheinlichkeit seiner Antworten sogar 80 % niedriger als bei OpenAI o3.

GPT-5 wurde auch auf dem neuen ARC-AGI-2 getestet. Mit Ausnahme von Grok 4 (Denken) schneidet es besser ab als alle anderen wichtigen Modelle.

Außerdem ist GPT-5 jetzt ein "ehrlicher Kerl". Es lügt den Nutzern weniger und prahlt nicht mehr so leicht damit, dass es Aufgaben erledigen kann, die es nicht kann. Wenn es auf eine Aufgabe trifft, die unmöglich zu erledigen ist, die Anweisungen unklar sind oder wenn es an wichtigen Werkzeugen fehlt, wird es ehrlicher über seine Grenzen kommunizieren.

Das interessanteste an dieser Aktualisierung ist die Einführung von vier neuen "Persönlichkeits"-Modi, die die Nutzer frei auswählen können. Sie sind:

Zyniker (Cynic)

Roboter (Robot)

Zuhörer (Listener)

Genie (Nerd)

Diese Modi sind optional. Sie können je nach Ihren Vorlieben festlegen, wie ChatGPT mit Ihnen interagiert und Fragen beantwortet. Möchten Sie, dass es mit Ihnen streitet oder dass es wie ein geduldiger Freund zuhört? Jetzt liegt es in Ihrer Hand.

"Dieses Modell hat ein wirklich gutes 'Gefühl'", sagt Nick Turley, der Leiter von ChatGPT. "Ich denke, die Leute werden das wirklich spüren, insbesondere die normalen Nutzer, die normalerweise nicht so sehr in Modelle hineinstudieren."

Außerdem können Sie für ein einzelnes Chatfenster das Farbthema ändern, was für die Liebhaber von Code-Editor-Themen ein Grund zur Freude ist.

02 Ist die Zeit des "Software-on-Demand" angebrochen? Die Codierungsfähigkeit ist unglaublich

Mit der weiteren Verbesserung der Codierungsfähigkeit prognostiziert Altman, dass die starke Codierungsfähigkeit von GPT-5 eine Zeit einleiten wird, die er "Software-on-Demand" nennt.

In den Tests von OpenAI hat GPT-5 in mehreren Codierungs-Referenztests wie SWE-Bench, SWE-Lancer und Aider Polyglot besser abgeschnitten als alle anderen Modelle. Es hat in den menschlichen Endtests 42 % und im SWE-Referenztest 75 % erreicht.

Ein kleiner Zwischenfall: Die Achsenbeschriftungen in einem Diagramm auf der Presskonferenz hatten offensichtlich viele Macken. Es gab nicht nur dumme Fehler wie 52,8 > 69,1, sondern es wurde auch die Verbesserung der Fähigkeiten von GPT-5 übertrieben. Auf den sozialen Medien wurde es von den Nutzern verspottet: "Ich hoffe, Sie haben dieses PowerPoint nicht mit GPT-5 erstellt."

Auf der Presskonferenz hat Yann Dubois, der Leiter der Nachbearbeitung von OpenAI, eine Live-Demonstration mit GPT-5 durchgeführt und es aufgefordert, eine Website zum Lernen von Französisch mit interaktiven Spielen zu erstellen. Innerhalb von wenigen Sekunden hat GPT-5 Hunderte von Codezeilen geschrieben und direkt die Front-End-Oberfläche der Website gezeigt. Er hat den Bildschirm über Zoom geteilt und einige einfache Klicks vorgenommen, und alles hat perfekt funktioniert.

Auf der Presskonferenz hat OpenAI auch direkt ein 3D-Spiel gezeigt, das von GPT-5 nur anhand eines Hinweistextes erstellt wurde. Die von ihm erstellten 3D-Szenen sind nicht nur optisch ansprechend, sondern auch die physikalischen Effekte sind sehr genau wiedergegeben.

03 Sicherer und "ehrlicher"

Nach Angaben von Alex Beutel, dem Leiter der Modellsicherheitsforschung, hat OpenAI GPT-5 "über fünftausend Stunden" getestet, um seine Sicherheitsrisiken zu verstehen. Ein Schwerpunkt war dabei, "zu gewährleisten, dass das Modell den Nutzern nicht lügt".

Obwohl GPT-5 weniger "Halluzinationen" hat als das OpenAI o3 Inferenzmodell, ist das Problem des "überzeugten Lügens" immer noch ein inhärentes Problem von großen Sprachmodellen. Wenn das Modell beginnt, Aufgaben wie ein Agent zu erledigen, wird dieses Problem noch komplexer. OpenAI hat jedoch erklärt, dass GPT-5 besser darin ist, mehrstufige Aufgaben zuverlässig zu bearbeiten. "In der Vergangenheit haben wir gesehen, dass Modelle behauptet haben, eine Aufgabe erledigt zu haben, aber tatsächlich nicht getan haben", sagt Beutel. "Das ist ein Problem."

Für Prompts, die es früher einfach abgelehnt hätte, wird GPT-5 ein von OpenAI genanntes "Sicheres Ergänzungs"-Mechanismus (safe completions) anbieten. Beutel hat erklärt: "Wenn jemand zum Beispiel fragt: 'Wie viel Energie benötigt man, um ein bestimmtes Material anzuzünden?' Dies könnte eine böswillige Frage sein, die versucht, die Sicherheitsvorkehrungen zu umgehen und Schaden anzurichten, oder es könnte ein Student sein, der die physikalischen Eigenschaften des Materials verstehen möchte. Dies stellt eine echte Herausforderung für das Modell dar, wie es antworten soll."

Durch das "Sichere Ergänzungs"-Mechanismus "versucht GPT-5, innerhalb der Sicherheitsbeschränkungen so hilfreiche Antworten wie möglich zu geben". Das Modell folgt normalerweise nur teilweise und gibt einige allgemeinere Informationen, die nicht tatsächlich zum Anrichten von Schaden verwendet werden können.

04 Wie kann man GPT-5 nutzen?

Also, jetzt kommt die wichtigste Frage: Wie kann man GPT-5 nutzen?

Die gute Nachricht ist, dass alle ChatGPT-Nutzer jetzt sofort GPT-5 kostenlos testen können. Dies ist auch das erste Mal, dass OpenAI ein fortschrittliches Modell für alle Nutzer kostenlos zugänglich macht. Natürlich haben Nutzer auf verschiedenen Ebenen unterschiedliche Rechte:

Plus-Abonnenten können vor Erreichen der Nutzungsgrenze mehrmals nutzen.

Pro-Abonnenten können auf die GPT-5 Pro-Version mit stärkerer Inferenzfähigkeit zugreifen.

Wenn die Nutzer die Nutzungsgrenze erreichen, wird ChatGPT automatisch auf eine "Mini-Version" von GPT-5 umschalten, um die nachfolgenden Anfragen zu bearbeiten. Gleichzeitig wird GPT-5 mit seiner Veröffentlichung offiziell eine Reihe von alten Modellen wie GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.