Google's Gemini 3.1 Pro, the new king, has arrived. It created the Windows 11 operating system in one go, developed a SimCity app, and the SVG effect is amazing.
Nachrichten von Zhidx vom 20. Februar. In der Nacht von heute hat Google offiziell sein neues Flaggschiff-Modell Gemini 3.1 Pro vorgestellt. Laut den von Google veröffentlichten Benchmark-Tests hat das leistungsfähigste Modell für komplexe Aufgaben, Gemini 3.1 Pro, in zwölf Tests Modelle wie Gemini 3 Pro, Claude Opus 4.6, Claude Sonnet 4.6 und GPT-5.2 übertroffen und den ersten Platz belegt.
Google DeepMind hat hauptsächlich die Schlussfolgerungsfähigkeit von Gemini 3.1 Pro verbessert. Im von der Branche als hochschwierig angesehenen ARC-AGI-2 Benchmark-Test für allgemeine Intelligenz hat Gemini 3.1 Pro eine beachtliche 77,1 % erzielt, Claude und GPT-Modelle übertroffen und gegenüber Gemini 3 Pro eine Verdopplung der Leistung erreicht.
Shunyu Yao, ein legendärer Physiker aus Tsinghua, der im vergangenen September Google DeepMind beigetreten ist, hat auch eine Nachricht über die Veröffentlichung des neuen Modells gepostet und gesagt: „Bessere Gemini-Modelle erscheinen mit unaufhaltsamer Geschwindigkeit.“
Der folgende Vergleich des klassischen „Pelikan auf einem Fahrrad SVG-Animations“ veranschaulicht anschaulich die Leistungssteigerung des neuen Modells. Das von Gemini 3.1 Pro auf der rechten Seite generierte Bild des Pelikans hat eine natürliche und sinnvolle Körperstruktur und Fahrhaltung, und Details wie das Fahrradgestell, die Kette, die Pedale und der Sattel sind vollständig. Im Vergleich zum Ergebnis von Gemini 3 Pro entspricht es den physikalischen Gesetzen und sieht wie eine vollständige Animationsszene aus.
Jiao Sun, ein ehemaliger Student von Tsinghua, der die SVG-Generierungsfunktion für Gemini 3.1 entwickelt hat, hat auf X kommentiert: „Ich bin unbeschreiblich stolz.“
Ab heute können die Abonnenten von Google AI Pro und Ultra Gemini 3.1 Pro in der Gemini-Anwendung und im AI-Assistenten NotebookLM nutzen. Die kostenlosen Benutzer können Gemini 3.1 Pro zweimal fragen. Entwickler und Unternehmensbenutzer können Gemini 3.1 Pro in AI Studio, Antigravity, Vertex AI, Gemini Enterprise, Gemini CLI und der Vorschauversion der Gemini API in Android Studio verwenden.
Die API-Preise der Vorschauversion von Gemini 3.1 Pro basieren auf einem Staffelpreissystem und bleiben mit denen der Vorschauversion von Gemini 3 Pro der vorherigen Generation überein. Bei weniger als 200.000 Token in der Eingabeaufforderung kostet die Eingabe pro Million Token 2 US-Dollar (etwa 14 Yuan) und die Ausgabe 12 US-Dollar (etwa 83 Yuan). Bei mehr als 200.000 Token in der Eingabeaufforderung kostet die Eingabe pro Million Token 4 US-Dollar (etwa 28 Yuan) und die Ausgabe 18 US-Dollar (etwa 124 Yuan).
01 .
Kann WebOS installieren und „Minecraft“ erstellen
Kann auch optische Täuschungen aufklären
Die Kern-Upgrades von Gemini 3.1 Pro konzentrieren sich auf die Fähigkeit, komplexe Aufgaben zu bewältigen. Aus dem Blog geht hervor, dass das neue Modell in Bezug auf fortgeschrittene Schlussfolgerung, multimodale Verständnis und die Generierung komplexer Projekte weiter verbessert wurde und besser auf anspruchsvolle Arbeitsumgebungen reagieren kann. Nach der Veröffentlichung des Modells haben die Community-Tests schnell gefolgt.
Der bekannte AI-Blogger Chetaslua hat das Ergebnis der einmaligen Installation von Windows 11 WebOS mit Gemini 3.1 Pro gezeigt.
Chetaslua schrieb in seinem Beitrag: „Als ich letztes Mal ein ähnliches Beispiel teilte, war es noch sehr schwierig, jetzt ist es zur Norm geworden. Mit dem Agentensystem können wir fast alles mit diesem Modell tun.“
Er hatte zuvor auch ein Video über die Generierung des Windows Web-Betriebssystems mit Gemini 3.0 Pro veröffentlicht. Der Vergleich der beiden Videos zeigt einen deutlichen Leistungsgewinn.
Die von Gemini 3.1 Pro generierte Systemoberfläche hat vollständige Anwendungsicons, ein Layout des Startmenüs und die grundlegende Interaktionslogik von Fenstern. Die Gesamtform ist näher an einem lauffähigen, leichten Betriebssystem.
Im Vergleich dazu war die von 3.0 Pro generierte Systemform relativ einfach, und einige grundlegende Desktop-Interaktionen und systemweite Anwendungen fehlten.
Ein weiteres, eher technisches Beispiel zeigt, dass ein Entwickler mit Gemini 3.1 Pro direkt in einem Browser ein interaktives VoxelWeb-Projekt generiert und ausgeführt hat, das in etwa wie ein 3D-Sandbox-Spiel wie „Minecraft“ aussieht.
Die Oberfläche enthält bereits einen Startknopf, Steuerungen für die Bewegung, die Interaktion mit Blöcken und die grundlegende Syntheselogik und hat die Grundzüge einer kompletten, leichten Sandbox.
In Bezug auf die Front-End-Generierung und die Details der Animation hat ein Entwickler das Modell aufgefordert, eine vollständige interaktive Wachstumsanimation zu generieren, die den gesamten Prozess von der Keimung der Samen, der Bildung der Wurzeln, dem Wachstum der Zweige bis zum Öffnen der Blätter abdeckt.
Die Testergebnisse zeigen, dass das Modell bei der Verbindung der Wachstumsphasen und den Blattdetails relativ vollständig ist. Der Entwickler bewertete: „Dies ist das beste Blattbild, das ich unter diesem Eingabehinweis gesehen habe.“
Die Tests in Bezug auf die visuelle Wahrnehmung haben die Schwierigkeit weiter erhöht. Ein Nutzer hat speziell die „AgenticVision“-Fähigkeit getestet, indem er ein scheinbar normales Foto eines Straßenmülleimers als Eingabe verwendet hat.
Das Modell hat nicht nur die grundlegende Erkennung durchgeführt, sondern auch festgestellt, dass beim Schielen oder Entfernen des Blickwinkels die Müll, Schatten und Konturen im Bild visuell zu zwei nebeneinander sitzenden Cartoon-Charakteren zusammengesetzt werden. Das Modell hat auch die Entstehungsmekanik dieser optischen Täuschung erklärt und die Beziehung zwischen verschiedenen Stoffen, Müllsäcken und Schatten und den Köpfen, Körpern und Außenkonturen der Charaktere erläutert, was seine Fähigkeit zur mehrstufigen visuellen Schlussfolgerung zeigt.
Gesamtbetrachtet beginnt Gemini 3.1 Pro, sich mit höheren visuellen Erkennungsaufgaben wie der Verständnis von Raumbeziehungen, der Abbildung von Formen und der Erklärung von optischen Täuschungen zu befassen. Die von den Entwicklern getroffene Bewertung ist, dass seine Leistung bereits in die Spitzengruppe gehört.
Wir haben auch Gemini 3.1 Pro mit Fallstrickfragen wie „Soll man mit dem Auto oder zu Fuß zu einer Autowaschanlage 100 Meter entfernt fahren?“ und „Können Eltern heiraten?“ gefragt, und es hat alle Fragen richtig beantwortet und die Fallstricke vermieden.
02 .
Eigenhändig „SimCity“ erstellen
Kreatives Programmieren und interaktives Design in Sekundenschnelle erledigt
Das offizielle X-Konto von Google DeepMind hat gezeigt, dass der Google-UX-Engineer Michael Chang mit Gemini 3.1 Pro eine realistische Stadtplanungsanwendung entwickelt hat. Gemini 3.1 Pro kann komplexe Gelände verarbeiten, Infrastrukturpläne zeichnen, Verkehr simulieren und schließlich hochwertige Visualisierungen generieren.
Außer dem oben erwähnten Pelikan auf einem Fahrrad ist Gemini 3.1 Pro auch bei der Generierung von SVG-Animationen von verschiedenen abstrakten Bildern wie einem Frosch auf einem alten Hochrad, einem Giraffen in einem Kleinwagen und einem Strauß auf Rollschuhen nicht hinterher. Im Vergleich zu Gemini 3 Pro ist die von Gemini 3.1 Pro generierte Szene insgesamt lebendiger und geschichtsträchtiger, und die Detaildarstellung hat sich erheblich verbessert.
So kann Gemini 3.1 Pro direkt auf der Grundlage von Textangaben animierte SVG-Dateien für Websites generieren. Da diese Animationen aus reinem Code statt aus Pixeln bestehen, bleiben sie in jeder Größe scharf, und die Dateigröße ist im Vergleich zu herkömmlichen Videos sehr klein.
Die Fähigkeit von Gemini 3.1 Pro zur komplexen Schlussfolgerung kann Benutzern helfen, mit komplexen APIs Designs zu erstellen. In dem folgenden Beispiel hat das Modell ein realtime Luft- und Raumfahrtinstrumentenbrett erstellt und den öffentlichen Fernmessdatensatz erfolgreich konfiguriert, um die Umlaufbahn der Internationalen Raumstation zu visualisieren.
In Bezug auf das interaktive Design kann Gemini 3.1 Pro Code schreiben und eine komplexe 3D-Simulation des Schwärmflugs von Starlingen generieren. Darüber hinaus kann es ein immersives Erlebnis erstellen, bei dem Benutzer den Starlingenschwarm über Gestenerkennung steuern können und gleichzeitig eine generierte Hintergrundmusik hören, die sich mit der Bewegung des Schwarmes ändert.
Gemini 3.1 Pro kann auch kreatives