OpenAI gibt erstaunlich zu: GPT-5 hat tatsächlich an Intelligenz verloren, aber es kann das "göttliche Manöver" wiederholen und zielt auf den Thron der Codegenerierung.
Hat GPT-5 in einem IQ-Test nur 70 Punkte erreicht? Hinter den heftigen Kritikpunkten im Internet über die angebliche "Intelligenzminderung" verbirgt sich die Tatsache, dass die "Routing"-Mechanismen die Intelligenz des Modells bestimmen. Um das wahre Potenzial von GPT-5 zu erschließen, liegt der Schlüssel im richtigen "Prompt". So haben Mediziner mit Hilfe von GPT-5 schon beeindruckende Leistungen erzielt.
72 Stunden nach der Veröffentlichung von GPT-5 hat ein IQ-Test-Ergebnis die ganze Welt schockiert.
Im Mensa-IQ-Test erreichte GPT-5 118 Punkte im Online-Test und 70 Punkte im Offline-Test. GPT-5 Thinking erzielte 85 Punkte und 57 Punkte in den jeweiligen Tests.
Dieses Ergebnis stellt den bisherigen Tiefststand aller IQ-Tests von OpenAI-Modellen dar.
Tatsächlich liegt der Grund hinter diesem Ergebnis in Problemen mit der "Routing"-Funktion.
Es ist nicht, dass GPT-5 zu dumm ist. Als "Einzelmodell" wird seine Intelligenz von einer seiner Komponenten bestimmt.
Ein ähnliches Problem wurde bereits von Altman in einer Reddit AMA-Session angesprochen.
Er erklärte, dass es zu einem schwerwiegenden internen Fehler (Sev-Ebene) kam und das automatische Umschalt-System nicht funktionierte, was dazu führte, dass GPT-5 wie ein Modell mit eingeschränkter Intelligenz wirkte.
Der neueste Bericht von METR zeigt, dass GPT-5 immer noch an der Pareto-Front liegt und seine Intelligenz exponentiell wächst, ohne sich abzuschwächen.
Das bedeutet, dass GPT-5 weiterhin das "Scaling Law" bestätigt.
GPT-5 ist stark, der Schlüssel liegt im Prompt
Viele Internetnutzer, die GPT-5 nur kritisiert haben, haben das wahre Potenzial des neuen Modells nicht erkannt.
Der Leiter der Künstlichen Intelligenz bei Cline sagte, dass der Kernpunkt in den Gedanken, den Vorlieben und der Kommunikationsweise eines Menschen liegt.
Für Nutzer mit einem systematischen Denkstil ist GPT-5 ein revolutionäres Werkzeug. Wenn man sich die Zeit nimmt, ein komplettes Denkrahmen zu erstellen und klare Anforderungen an das Modell zu stellen, kann es diese Aufgaben autonom und präzise ausführen, ohne dass manuelle Korrekturen erforderlich sind.
Ähnlich äußerte sich auch Mark Manson, ein Bestsellerautor der NYT. Er sagte, dass alle Menschen GPT-5 auf die falsche Weise ansprechen und dass der Schlüssel darin liegt, die Initiative zu ergreifen.
Wenn man dem Modell zeigt, dass man nicht so leicht zu täuschen ist, wird es perfekte Antworten geben.
Zum Beispiel, wenn man GPT-5 fragt, wie viele "b" in "blueberry" vorkommen und es droht, dass es mit Bambi's Mutter zu tun kriegen wird, wenn es die falsche Antwort gibt, wird es keine Fehler machen.
Ein weiteres Beispiel ist, dass viele Internetnutzer meinten, GPT-5 könne keine einfache Gleichung lösen. Der wirkliche Trick liegt aber auch im Prompt.
Wenn der Prompt "Denke nach und löse die Aufgabe" lautet, kann es die richtige Lösung finden.
Was ist ein wirksamer Prompt? Ein Internetnutzer hat die System-Prompts von GPT-5 preisgegeben, die wie ein Goldmine wirken.
Der "göttliche Zug"
Im medizinischen Bereich kann GPT-5 bereits mit menschlichen Experten mithalten.
Der Biomediziner Derya Unutmaz spürte nach der Nutzung von GPT-5 das Gefühl wie beim "37. Zug" von AlphaGo.
Vor zwei Jahren führte Deryas Labor eine Reihe von immunologischen Experimenten durch, um den Energiestoffwechsel von T-Zellen zu regulieren.
Diese Immunzellen haben einen großen Einfluss auf die Krebstherapie, chronische Krankheiten und Autoimmunerkrankungen.
Damals erzielten sie ein beeindruckendes Ergebnis, aber es gab eine Entdeckung, die sie nicht erklären konnten.
Das Team arbeitete mehrere Wochen daran, aber es bekam nur teilweise Antworten.
Basierend auf diesen Experimenten hat Derya ein unveröffentlichtes Datendiagramm an GPT-5 Pro zur Analyse gesendet, und das Ergebnis war erstaunlich.
GPT-5 erkannte anhand dieses Diagramms genau die Schlüsselentdeckung und gab Vorschläge für weitere Experimente.
Das Unglaubliche ist, dass der von ihm vorgeschlagene Mechanismus alle Ergebnisse erklären konnte.
Derya Unutmaz sagte, dass dies der "göttliche Zug" im Bereich der Künstlichen Intelligenz sei. Dieser Prozess hat bewiesen, dass GPT-5 zu einem Spitzenexperten und einem echten Forschungspartner geworden ist, der tiefgreifende Einblicke geben kann.
OpenAI zielt mit GPT-5 auf den Thron von Anthropic
Obwohl GPT-5 noch kein vollständiges AGI ist, hat seine starke Programmierfähigkeit bereits viele Entwickler angelockt.
Außerdem könnten die neuen individuellen Optionen und die reduzierte "Halluzinations"-Rate GPT-5 für mehr alltägliche Nutzer des kostenlosen ChatGPT attraktiv machen.
Dies ist eindeutig eine Herausforderung an Anthropic.
Der Grund dafür ist, dass das stärkste KI-Modell für das Schreiben von Code bisher das Claude-Modell von Anthropic war.
Deshalb betonte OpenAI bei der Veröffentlichung des neuen Modells die starke Programmierfähigkeit von GPT-5.
GPT-5 ist bisher das stärkste Programmier-Modell. Es zeichnet sich besonders bei der Erstellung komplexer Frontends und der Fehlersuche in großen Code-Bibliotheken aus.
Mit nur einem Prompt kann es anschaulich und elegant schöne, reaktionsfähige Websites, Anwendungen und Spiele erstellen und Ideen in die Realität umsetzen.
Die Absicht ist klar.
Bei der Pressekonferenz sagte Altman, dass das neue Modell nicht nur gut im Programmieren ist, sondern auch Softwareprojekte direkt von der Idee in nutzbaren Code umwandeln kann.
Verschiedene Programme, die von GPT-5 erstellt wurden
Pietro Schirano, der CEO der KI-Startup MagicPath, nannte GPT-5 das beste derzeitige Programmier-Modell und einen "perfekten Partner". Er sagte:
Das ist wie die Einführung von Elektrizität in die Haushalte, ein "unvorhergesehener" Wendepunkt, der unsere Entwicklungsweise grundlegend verändern wird.
Während der einstündigen Live-Übertragung zeigte OpenAI hauptsächlich die Programmierfähigkeit von GPT-5 und präsentierte auch eine Reihe von Benchmark-Ergebnissen.
Unternehmen wie Cursor, Vercel und JetBrains teilten auch ihre Erfahrungen aus den frühen Tests von GPT-5 mit.
Michael Truell, der CEO des "AI-Programmier"-Tools Cursor, lobte es als "das intelligenteste Code-Modell, das ich je benutzt habe":