StartseiteArtikel

Echtzeit-Test von GPT-5.2: Preise steigen stark, Leistung nur marginal. Womit soll es gegen Gemini antreten?

爱范儿2025-12-12 18:00
Die Listen wurden alle gefälscht, aber es scheint, dass es nicht so bequem wie bei Gemini ist.

Das GPT 5.2, das das Gemini schlagen soll, wurde heute in der frühen Morgenstunde offiziell veröffentlicht und allen Benutzern zugänglich gemacht.

Ich habe erst letzten Monat mein ChatGPT Plus-Abonnement gekündigt und zu Gemini gewechselt. Muss ich jetzt wegen des GPT-5.2 wieder zurückkehren?

Nachdem Sie die echten Erfahrungsberichte von Nutzern und die eigenen Testberichte von APPSO gelesen haben, werden Sie vielleicht eine Antwort finden.

Diesmal hat es endlich die Tabelle richtig gezeichnet.

Das GPT 5.2 hat tatsächlich drei Modelle aktualisiert: das GPT-5.2 Instant, das Thinking und das Pro-Modell. Wenn Sie es gewohnt sind, dass das Gemini 3.0 Pro bei jeder Frage und Antwort nachdenkt, werden Sie feststellen, dass ChatGPT beim GPT-5.2 Thinking/Pro langsamer denkt und länger braucht als bisher.

Das ist auch das Fazit der meisten Benutzer, die eine Vorabversion getestet haben und es in den sozialen Medien geteilt haben. Das GPT-5.2 hat in allen Aspekten gegenüber dem 5.1 verbessert, und das GPT-5.2 Pro eignet sich hervorragend für professionelle Inferenzarbeiten und Aufgaben, die viel Zeit in Anspruch nehmen. Allerdings wird der Warteprozess auf das Ergebnis länger.

Beispielsweise hat ein Benutzer berichtet, dass das GPT-5.2 Pro 24 Minuten gebraucht hat, um eine Tabelle mit den HLE-Testergebnissen zu erstellen, nachdem er den Hinweis "Zeichne mir eine Tabelle mit den HLE-Testergebnissen" eingegeben hat.

Bildquelle: https://x.com/emollick/status/1999185755617300796/photo/1

Glücklicherweise sind alle Informationen korrekt, auch wenn das beste Ergebnis in der Tabelle immer noch das Gemini 3.0 Pro ist.

Dies liegt daran, dass das Wissensende von GPT-5.2 auf August 2025 aktualisiert wurde. Das Wissensende von GPT-5.1 lag noch im September 2024, und das von Gemini 3.0, das erst letzten Monat veröffentlicht wurde, endet im Januar 2025.

Als wir das GPT-5.2 Thinking nutzen, um eine Tabelle mit der Veröffentlichungsgeschichte der OpenAI-Modelle zu generieren, hat es nicht allzu lange gedauert, und die Informationen waren auch ziemlich genau. Bei einfachen Aufgaben besteht ein großer Unterschied zwischen der Zeit, die das Thinking-Modell und das Pro-Modell benötigen.

Hinweis: generate a chart graph of OpenAI model release over time

Dank seiner "extrem starken" Inferenzfähigkeit, des neuesten Weltwissens und der Fähigkeit zur multimodalen Verständnis und Inferenz von Bildern hat das GPT 5.2 schnell auf dem Feld der großen Modelle auf Platz zwei gestiegen. Das GPT-5.2-High belegt Platz zwei im WebDev-Projekt, und das GPT-5.2 belegt Platz sechs. Zum Vergleich: Das Gemini 3.0 Pro belegt Platz drei, und der erste Platz geht weiterhin an Claude.

Die LMArena hat auch ein Testvideo veröffentlicht, in dem sie mit dem GPT-5.2 eine Reihe von 3D-Modellierungsarbeiten durchgeführt haben, und die Ergebnisse waren sehr gut. Dennoch haben einige Benutzer kommentiert: "Sind wir noch im Jahr 2003?"

Videoquelle: https://x.com/arena/status/1999189215603753445

Für diese 3D-Effekte, die mit three.js realisiert werden, sind eine starke multimodale Verständnis- und Inferenzfähigkeit des Modells sowie Optimierungen in der Programmierung und Softwareentwicklung erforderlich. Das GPT-5.2 hat sich auch diese 0,1-Upgrade verdient.

Die meisten Tests von Nutzern konzentrieren sich derzeit auf die Erstellung vollständiger 3D-Engines, und das GPT-5.2 hat sich auch hier gut bewährt. Beispielsweise hat jemand mit dem hochschwierigen Inferenzmodus von GPT-5.2 Thinking ein interaktives 3D-Modell eines eisigen Königreichs in Schneewetter erstellt, das auch in 4K aufgelöst exportiert werden kann.

https://x.com/skirano/status/1999182295685644366

Es gibt auch ein 3D-Modell einer gotischen Stadt mit wilden Wellen, das mit GPT-5.2 Pro erstellt wurde.

Hinweis: create a visually interesting shader that can run in twigl-dot-app make it like an infinite city of neo-gothic towers partially drowned in a stormy ocean with large waves. | Quelle: https://x.com/emollick/status/1999185085719887978?s=20

Bezüglich der 3D-Verständnis- und Inferenzfähigkeit haben wir auch die gleichen Hinweise wie Ian Goodfellow nach der Veröffentlichung von Gemini 3.0 Pro verwendet. Wir haben ein Bild hochgeladen und dem Modell gesagt, dass es basierend auf diesem Bild eine schöne Voxel-Art-Three.js-Einzelseitenanwendung erstellen soll.

Da ChatGPT das Bild nicht im Canvas generiert hat, habe ich den generierten Code in der Dialogbox kopiert und in der HTML-Ansicht geöffnet, wie im rechten Bild zu sehen ist.

Der Unterschied ist ziemlich deutlich. ChatGPT hat zwar den Inhalt des hochgeladenen Bildes erkannt, nämlich einen rosa Baum, ein grünes Feld und eine graue Senke sowie weiße Wasserströme, aber das generierte 3D-Animations ist im Vergleich zu Gemini 3.0 Pro etwas schlicht.

Ich kann nur sagen, dass Altmans "Roter Alarm" zeigt, dass Gemini wirklich leistungsfähig ist.

Bei den Tests zur Programmierfähigkeit fehlt natürlich das klassische physikalische Bewegungsproblem der Sechseckkugeln nicht. Ein Blogger hat die Schwierigkeit der Kugelbewegung erhöht und alle Kugeln als leuchtende rote 3D-Kugeln gestaltet. Das Ergebnis sieht sehr cool aus, und viele Benutzer fragen, wie das gemacht wurde. Aber einige haben auch darauf hingewiesen, dass die Kugeln scheinbar nicht von der Schwerkraft beeinflusst werden.

Dann hat ein Benutzer geantwortet, dass dies eine Simulation des Weltraums darstellt.

Videoquelle: https://x.com/flavioAd/status/1999183432203567339

Es gibt auch einen SVG-Code-Test mit einem radfahrenden Pelikan.

Bildquelle: https://arena.jit.dev/

Einige Benutzer haben auch berichtet, dass sie mit GPT-5.2 einen Waldbrand-Simulator erstellt haben, mit dem man die Geschwindigkeit, die Größe der Gebiete und den Ausbreitungsbereich des Feuers einstellen kann.

Bildquelle: https://x.com/1littlecoder/status/1999191170581434557?s=20

Wir haben eine Website für Planetsignale erstellt, die in der Layout ähnlich wie die Website für die Visualisierung des Waldbrandes ist. Links werden die Inhalte angezeigt, und die Sternchen wurden durch Weltraumplaneten ersetzt.

Hinweis: Create an interactive HTML, CSS, and JavaScript simulation of a satellite system that transmits signals to ground receivers. The simulation should show a satellite orbiting the Earth and periodically sending signals that are received by multiple

Wir haben auch das gleiche, was wir mit Gemini 3 gemacht haben, dem GPT-5.2 vorgelegt. Wir haben den gleichen Hinweis eingegeben und es aufgefordert, eine Webkamera-App im Vintage-Polaroid-Stil zu entwickeln.

Hinweis: Entwickle eine einseitige Kamera-App im Vintage-Polaroid-Stil. Das Hintergrund der Seite sollte als Korkwand oder dunkles Holzdesign gestaltet werden. Ecke links unten sollte ein polaroides Kameramodell aus reinem CSS oder SVG fest positioniert werden, dessen Objektivbereich das Bild der Benutzerkamera in Echtzeit anzeigt. Im Interaktionslogik sollte beim Klicken auf den Verschlussknopf ein Verschlussgeräusch abgespielt werden und ein Foto mit weißer Umrandung langsam aus der Oberseite der Kamera herauskommen. Verwende CSS-Filter, um das herausgleitende Foto zunächst stark verschwommen und schwarzweiß zu gestalten und es innerhalb von 5 Sekunden sanft in einen scharfen, vollfarbigen Zustand zu überführen. Schließlich müssen alle entwickelten Fotos frei verschiebbar sein, sodass der Benutzer sie beliebig auf der Seite platzieren kann. Die Fotos sollten eine zufällige, kleine Rotation und einen Schatten haben. Wenn auf ein Foto geklickt wird, sollte es nach oben gebracht werden, um eine realistische, freie Foto-Kollagewand zu erzeugen.

Es war etwas überraschend, dass ChatGPT es tatsächlich geschafft hat, eine Polaroid-App zu erstellen.

Als wir das Gemini 3.0 Pro getestet haben, war seine stärkste Fähigkeit einerseits die Programmierung und andererseits die Tatsache, dass wir keine langen Hinweise eingeben mussten. Wir mussten nur ein Screenshot oder ein Video hochladen und ihm sagen, dass es es nachbauen sollte, und es hat es geschafft.

Diesmal haben wir ihm ebenfalls ein Video gegeben und es aufgefordert, die Website für die Generierung von klassischen chinesischen Gedichten zu reproduzieren.

https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581

Im Vergleich zu GPT-5.1, das überhaupt nicht verstanden hat, welches Farbschema das hochgeladene Video hatte, hat es diesmal gelernt. Allerdings kann die von Gemini generierte Website direkt mit AI-Funktionen erweitert werden, indem die API von Gemini verwendet wird. ChatGPT hat jedoch noch keine AI in die generierten Websites integriert, sodass hier die Gedichte weiterhin nur die bereits vorhandenen sein können.

Abgesehen von den klassischen Tests zur Programmierfähigkeit und der einfachen Erstellung einer Einseitigen HTML-Datei haben einige Benutzer auch Python-Code geschrieben.

Der Benutzer hat den Hinweis "write a python code that visualizes how a traffic light works in a one way street with cars entering at random rate." (Schreibe einen Python-Code, der das Funktionieren einer Ampel in einer Einbahnstraße visualisiert und zufällig eintretende Autos simuliert) eingegeben.

Er hat gleichzeitig das GPT 5.2 Extended Thinking und das Claude Opus 4.5 getestet, und das Ergebnis ist offensichtlich. Viele Leser fragen uns immer, welches das beste Programmier-Modell ist. Claude wird von so vielen Entwicklern geschätzt, und das hat seinen Grund.