StartseiteArtikel

Die kleinste Iteration von Googles Gemini. Warum ruft Yao Shunyu: "Unaufhaltsam!"?

字母AI2026-02-21 10:24
Besonders gut darin, "extrem komplexe Aufgaben" zu bewältigen

Die Leute reden immer noch begeistert über das komische Bild, wie die Chefs von OpenAI und Anthropic abgelehnt haben, die Hände zu schütteln, und stattdessen die Fäuste in die Höhe hoben. Andererseits hat Google ruckzuck sein Modell aktualisiert.

Und diese Aktualisierung ist wie ein Wolf in Schafskleidung – wenn man sich die Nummern im Modell-Suffix ansieht, ist dies Googles kleinste Aktualisierung bisher. Früher wechselte man von Gemini 2.0 zu Gemini 2.5. Diesmal geht es von Gemini 3.0 zu Gemini 3.1 Pro Preview.

Aber diese Aktualisierung um ".1" bringt erstaunliche Fortschritte.

Google-Chef Sundar Pichai hat erklärt, dass das neue Modell ausgezeichnet darin ist, "extrem komplexe Aufgaben" zu bewältigen. Beispielsweise kann es komplexe Konzepte visualisieren, Daten zu einer einzigen Übersicht zusammenfassen oder kreative Projekte umsetzen.

Yao Shunyu hat auch auf X einen Beitrag geschrieben, um sich für das Gemini 3.1 Pro Preview einzusetzen und lobt es:

"Gemini ist nicht nur ein gutes Modell, sondern es kommen noch bessere Modelle unaufhaltsam daher."

Es ist zu beachten, dass Google vor etwa einer Woche den "spezifischen Inferenzmodus" Gemini 3 Deep Think eingeführt hat, der speziell für komplexe und offene Fragen in Wissenschaft, Forschung und Technik entwickelt wurde.

Demini 3 Deep Think war das erste Projekt, an dem Yao Shunyu nach seinem Wechsel von Anthropic zu Google DeepMind beteiligt war.

Das aktuelle Gemini 3.1 Pro Preview und das Gemini 3 Deep Think sind eng miteinander verbunden. Die Offizielle Seite erklärt, dass es "direkt auf der Erfahrung und Technologie von Gemini 3 Deep Think aufbaut". Dies entspricht einer "Verteilung" der Kern-Inferenztechnologien von Deep Think auf das breiter nutzbare Pro-Modell.

01

Was kann das Gemini 3.1 Pro Preview?

Da das neue Modell in der Lage ist, "extrem komplexe" Aufgaben zu bewältigen, werden normale Gespräche mal beiseite gelassen. In Googles offizieller Blog-Nachricht werden einige Beispiele gezeigt, um die Stärken des Modells zu demonstrieren.

Erstens: Erstellen von SVG-Animationen mit einfachen Anweisungen.

Diese Funktion gab es auch im Vorgänger-Modell, aber der Fortschritt ist deutlich.

Beispielsweise die Anweisung: "Erstelle ein SVG, das eine Chamäleon still auf einem Ast sitzen zeigt. Lasse die Augen des Chamäleons dem Mauszeiger des Benutzers auf dem Bildschirm folgen."

Die Animation, die von Gemini 3 Pro erstellt wurde, hat einen einfachen weißen Hintergrund. Das Chamäleon sieht stumpf aus und hat sogar zwei Augen auf einer Seite.

Die Animation, die von Gemini 3.1 Pro erstellt wurde, hat einen "dunkelgrünen Dschungel"-Hintergrund. Das Chamäleon hat gelbe Streifen und Punkte auf dem Körper, die Augen sind dreidimensional und die Beine sind natürlich gebeugt.

Noch ein Beispiel: "Erstelle ein SVG eines Schieberschalters. Wenn die Maus über dem Sonnensymbol schwebt, verwandle es in einen leuchtenden Mond, während sich der Hintergrund sanft von hell nach dunkel ändert. Verwende einen sauberen, flachen UI-Stil."

Die Animation, die von Gemini 3 Pro erstellt wurde, hat die Aufgabe zwar erfüllt, das Symbol kann sich mit der Maus ändern, aber das Hauptsymbol ist einfach, ein Kreis mit einem fehlenden Winkel, wobei gelb für den Tag und weiß für die Nacht steht.

Die Animation, die von Gemini 3.1 Pro erstellt wurde, ist viel komplexer. Tagsüber ist es eine gelbe Sonne und weiße Wolken, nachts ist es ein Halbmond und Sterne. Die beiden Symbole ändern sich reibungslos.

Insgesamt lässt die Animation von Gemini 3 Pro an den alten Internet-Meme "3 Jahre Animation gelernt" denken.

Die SVG-Animationen, die von Gemini 3.1 Pro erstellt werden, können direkt verwendet werden.

Zweitens: Aufbau von Systemen auf Ingenieur-Ebene.

Das Gemini 3.1 Pro kann bereits anhand einer komplexen natürlichen Sprachanweisung direkt ein komplettes interaktives System erstellen, das 3D-Rendering, Echtzeit-Sonnenkalender-Berechnung, asynchrones API-Abfragen und physikalische Lichteffekte integriert, und nicht nur eine einfache Webseite-Demo.

In einem Beispiel von Google hat ein Benutzer eine Textanweisung gegeben, und das Gemini 3.1 Pro hat einen hochauflösenden, interaktiven 3D-Bahnverfolger der Internationalen Raumstation (ISS) erstellt. Dabei wird ein detailliertes 3D-Erdmodell mit hochauflösenden Blue Marble-Texturen gerendert.

Drittens: Erstellung von interaktiven kreativen Systemen.

In einem anderen Beispiel hat Google eine komplexe 3D-Simulation des Schwarmflugs von Starlingen (murmuration) gezeigt, die von Gemini 3.1 Pro geschrieben wurde.

Es erstellt nicht nur visuellen Code, sondern auch eine immersive Erfahrung. Benutzer können den Starlingenschwarm über die Handverfolgung steuern und eine generierte Musik hören, die sich je nach Bewegung des Schwarmes ändert.

Für Forscher und Designer bietet dies eine starke Möglichkeit, sensorisch reiche Benutzeroberflächen zu prototypen.

Viertens: Umwandlung von literarischen Themen in ausführbaren Code.

Dieses Beispiel ist vielleicht dasjenige, bei dem die Leistung auch für normale Menschen am leichtesten nachvollziehbar ist.

Als man es aufgefordert hat, eine moderne persönliche Portfolio-Website für "Wuthering Heights" von Emily Brontë zu erstellen, hat das Modell nicht einfach den Textinhalt zusammengefasst, sondern basierend auf der Atmosphäre und Emotion des Romans geschlossen und eine einfache, zeitgemäße Benutzeroberfläche entworfen, um eine Website zu erstellen, die den Geist der Hauptcharaktere einfängt.

Abstraktes Denken – die Bedeutung dieser Fähigkeit braucht nicht weiter erklärt zu werden.

02

Wie stark ist es eigentlich?

Neue Modelle müssen natürlich durch die Tests gehen.

Und die Aktualisierung um ".1" hat enorme Verbesserungen gebracht.

Nach den Testergebnissen, die in Googles offizieller Blog-Nachricht veröffentlicht wurden:

Im ARC-AGI-2-Benchmark hat das 3.1 Pro einen Validierungswert von 77,1% erreicht. Dies ist mehr als doppelt so gut wie die Inferenzleistung des 3 Pro.

Dies entspricht auch den Beispielen des 3.1 Pro, da dieser Test die Fähigkeit des Modells misst, neue logische Muster zu lösen. Mit anderen Worten: die Fähigkeit, abstrakte Rätsel zu lösen.

Außerdem hat das 3.1 Pro im GPQA Diamond (Wissenschaftliches Wissens-Test) einen Wert von 94,3% erreicht; im Agenten-Benchmark MCP Atlas 69,2%; und im Benchmark BrowseComp für Echtzeit-Websuche und Informationsintegration 85,9%.

Diese Ergebnisse übertreffen die von Anthropics Sonnet 4.6, Opus 4.6 sowie OpenAIs GPT-5.2 und GPT-5.3-Codex.

Googles Gemini 3.1 Pro hat in diesem ARC-Abstraktes-Denken-Test und im BrowseComp-Suchtest einen deutlichen Abstand geschaffen und zeigt eine deutliche Tendenz zu Agenten, anstatt ein reines Wissensmodell zu sein.

Außerdem hat eine unabhängige Testorganisation, die sich auf Benchmark-Tests und Vergleichsanalysen von großen Modellen spezialisiert hat, die entsprechenden Testergebnisse veröffentlicht und lobt, dass das Gemini 3.1 Pro in 6 von 10 Tests, die den Artificial Analysis Intelligence Index bilden, vorne liegt. Im Vergleich zum Gemini 3 Pro Preview hat es in vielen Fähigkeiten deutliche Verbesserungen gebracht, insbesondere in der Inferenz und Wissen, der Code-Fähigkeit und der Reduzierung von Halluzinationen.

Außerdem hat das Gemini 3.1 Pro Preview eine hohe Token-Effizienz.

Für den vollständigen Artificial Analysis Intelligence Index werden etwa 57 Millionen Token benötigt (1 Million mehr als beim Gemini 3 Pro Preview).

Dieser Token-Verbrauch ist niedriger als bei anderen führenden Modellen im maximalen Inferenzmodus, wie Opus 4.6 (max) und GPT-5.2 (xhigh).

Zusammen mit der niedrigeren Preisgestaltung pro Token hat das Gemini 3.1 Pro Preview einen Kostenvorteil gegenüber anderen führenden Modellen. Die Kosten für den vollständigen Intelligence Index sind weniger als die Hälfte von Opus 4.6 (max), aber immer noch etwa doppelt so hoch wie die des führenden Open-Source-Modells GLM-5.

03

Doppelte Leistung, gleicher Preis

Die Preise für Googles offizielle API zeigen, dass die Gebührenstruktur für Gemini 3 Pro/3.1 Pro Preview auf der Anzahl der Token basiert:

Bei weniger als 200.000 Tokens kostet die Eingabe etwa 2 US-Dollar pro Million Token, die Ausgabe 4 US-Dollar. Bei mehr als 200.000 Tokens kostet die Eingabe 4 US-Dollar pro Million Token, die Ausgabe 18 US-Dollar.

Beim Caching des Kontexts werden je nach Größe der Anweisung zwischen 0,20 und 0,40 US-Dollar pro Million Token berechnet, plus eine Speichergebühr von 4,50 US-Dollar pro Million Token pro Stunde.

Dieser Preis entspricht insgesamt dem des Vorgängers, des Gemini 3 Pro. Im Vergleich zu Anthropics Opus-Serie ist er jedoch relativ günstig. Die Eingabe-/Ausgabe-Preise für Opus-Modelle liegen bei etwa 5/25 US-Dollar.

Insbesondere angesichts seiner hervorragenden Modellleistung ist dieser Preis sehr konkurrenzfähig.

Vergessen Sie nicht, dass Google bisher nur die "Preview" veröffentlicht hat. Bald wird die offizielle Version folgen. Und die Aktualisierung um ".1" ist eher ein