Das weltweit erwartete Gemini 3 ist endlich da. Es ist so stark, dass es um Längen voraus liegt. Selbst Musk und OpenAI loben es.
Zhidongxi berichtete am 19. November. In der frühen Morgenstunde heute hat Google endlich sein stärkstes Inferenzmodell, Gemini 3, vorgestellt. Ein einziges Modell vereint native Multimodularität, Inferenzfähigkeiten und Agent-Fähigkeiten.
Das Forschungsteam von Google DeepMind hat erklärt, dass dies das weltweit fortschrittlichste Multimodell-Verständnis-Modell und Googles leistungsstärkstes Agent-Programmier- und Atmosphären-Programmier-Modell sei. Es könne noch reichhaltigere visuelle Effekte und tiefere Interaktionserlebnisse bieten und sei vollständig auf der Grundlage der fortschrittlichsten Inferenztechnologien aufgebaut.
Dieses Modell wird auf Googles TPU trainiert und unterstützt ein Kontextfenster von 1 Million Tokens. Es eignet sich für Anwendungen, die die folgenden Funktionen erfordern: Agent, fortgeschrittene Programmierung, langer Kontext, Multimodell-Verständnis und Algorithmenentwicklung.
Sobald es veröffentlicht wurde, hat Gemini 3 fast alle Testdatensätze dominiert und mit 1501 Elo-Punkten den ersten Platz in der LMArena, einer Plattform für die Bewertung von großen Modellen, belegt.
Sam Altman, Mitbegründer und CEO von OpenAI, sowie Elon Musk, Gründer und CEO von xAI, haben Google ihre Glückwünsche zugesandt. Altman hat in einem Tweet kommentiert: "Gemini 3 sieht sehr gut aus." Google-CEO Sundar Pichai hat mit einem Emoticon geantwortet.
Musk hat einen Tweet von Demis Hassabis, CEO von Google DeepMind, geteilt und kommentiert: "Gut gemacht."
Ab heute wird Google Gemini 3 auf folgenden Plattformen bereitstellen:
Für alle Benutzer von Gemini-Anwendungen sowie für Benutzer, die Google AI Pro und Ultra-Abonnements in der KI-Modus der Suche nutzen; Für Entwickler, die die Gemini-API, Googles neues Agent-Entwicklungsportal Antigravity und die Gemini CLI nutzen; Für Unternehmensbenutzer, die Vertex AI und die Unternehmensversion von Gemini nutzen.
Darüber hinaus wird Google in den kommenden Wochen die Deep-Thinking-Funktion von Gemini 3 für Abonnenten von Google AI Ultra freischalten. Derzeit wird noch eine Sicherheitsbewertung durchgeführt.
Bezüglich der Veröffentlichung von Gemini 3 meint Pichai, dass dieses Modell es Benutzern ermöglichen kann, jede Idee in die Realität umzusetzen.
01.
Interaktive Spiele und Apps in Minuten entwickeln
Und dir helfen, neue Kenntnisse zu erwerben
Schauen wir uns zunächst an, was Gemini 3 Pro leisten kann.
Gemini 3 kann Code für die Visualisierung des Plasmastroms in einem Tokamakgerät schreiben und Gedichte verfassen, die die physikalischen Prinzipien der Kernfusion erfassen.
Wenn ein Benutzer traditionelle Familienrezepte lernen möchte, kann Gemini 3 handschriftliche Rezepte in verschiedenen Sprachen interpretieren und übersetzen und daraus ein teiles Family-Rezeptbuch erstellen.
Wenn ein Benutzer sich für ein neues Thema interessiert, kann er wissenschaftliche Artikel, lange Videovorträge oder Tutorials in Gemini 3 eingeben. Das Modell kann dann interaktive Karteikarten, Visualisierungen oder Code in anderen Formaten generieren, um dem Benutzer zu helfen, diese Inhalte zu verstehen.
Gemini 3 kann Videos von Pickleball-Spielen analysieren, Bereiche identifizieren, die verbessert werden können, und ein Trainingsprogramm für die Verbesserung der gesamten Spielweise erstellen.
Im KI-Suchmodus kann Gemini 3 komplexe Themen lernen. Beispielsweise kann es mit Hilfe der generativen Benutzeroberfläche im KI-Modus der Suchfunktion komplexe Themen wie den Wirkungsmechanismus der RNA-Polymerase verstehen. Bemerkenswerterweise ist dies das erste Mal, dass Google ein neues Modell direkt in die KI-Suchfunktion integriert, sobald es veröffentlicht wird.
Gemini 3 kann ein retro-stilisiertes 3D-Schiffspiel mit einem reichhaltigen visuellen Interface und hoher Interaktivität entwickeln.
Dieses Modell kann durch das Erstellen, Zerlegen und Neuinterpretieren von feinen 3D-Voxel-Kunstwerken die Vorstellungen der Benutzer in die Realität umsetzen.
Gemini 3 kann mit Shadern ein spielbares Science-Fiction-Welt erzeugen.
Es kann auch praktikablere und interaktivere Webseiten und Apps generieren.
02.
Dominiert Testdatensätze
Hebt die Leistungsgrenze von großen Modellen an
Schauen wir uns nun die Benchmark-Ergebnisse von Gemini 3 Pro an.
Im Google-Blog wird erwähnt, dass Gemini 3 Pro in einer Reihe von Benchmark-Tests evaluiert wurde, einschließlich Inferenzfähigkeiten, Multimodularität, Agent-Werkzeugnutzung, Mehrsprachigkeit und langer Kontext. Es hat in allen wichtigen KI-Benchmark-Tests Gemini 2.5 Pro bei weitem übertroffen und mit 1501 Elo-Punkten den ersten Platz in der LMArena belegt.
Dieses Modell zeigt Doktoratsniveau in der Inferenzfähigkeit. Es hat in "The Ultimate Human Test" (37,5 % ohne Verwendung von Tools) und in der GPQA Diamond-Testung die Höchstpunktzahl erreicht und in der MathArena Apex-Testung eine neue Spitzenleistung von 23,4 % erzielt.
Außer in Texten hat Gemini 3 Pro in MMMU-Pro 81 %, in Video-MMMU 87,6 % in der multimodalen Inferenz und in SimpleQA Verify sogar 72,1 % erreicht.
Dies bedeutet, dass Gemini 3 Pro komplexe Probleme in einem breiten Spektrum von Themen, einschließlich Wissenschaft und Mathematik, mit hoher Zuverlässigkeit lösen kann.
Die Deep-Thinking- und Multimodell-Verständnis-Fähigkeiten von Gemini 3 können Benutzern helfen, noch komplexere Probleme zu lösen. In Tests hat Gemini 3 Deep Think in "The Ultimate Human Test" (41,0 % ohne Tools) und in GPQA Diamond (93,8 %) bessere Ergebnisse erzielt als Gemini 3 Pro. Es hat in ARC-AGI-2 (Codeausführung, ARC-Award-Zertifizierung) 45,1 % erreicht, was sowohl Googles eigene Vorgängermodelle als auch die Modelle von OpenAI und Anthropic übertrifft.
In Bezug auf die Programmierfähigkeit ist Gemini 3 das beste Atmosphären- und Agent-Programmier-Modell, das Google bisher entwickelt hat.
Dieses Modell hat mit 1487 Elo-Punkten die Spitze der WebDev-Arena-Tabelle erreicht. In Terminal-Bench 2.0, einem Test für die Werkzeugnutzung von Modellen, hat es 54,2 % erreicht und in SWE-bench Verified, einem Benchmark für die Programmierung von Agenten, hat es Gemini 2.5 Pro bei weitem übertroffen.
Entwickler können Gemini 3 in Google AI Studio, Vertex AI, der Gemini CLI und Googles neuem Agent-Entwicklungsportal Google Antigravity nutzen. Es wird auch von Drittanbieterplattformen wie Cursor, GitHub, JetBrains, Manus und Replit unterstützt.
Seit Gemini 2 hat Google viele Fortschritte bei der Entwicklung von Agenten mit dem Gemini-Modell gemacht. Diesmal hat Gemini 3 auch die Vending-Bench 2-Tabelle an der Spitze platziert. Dieser Benchmark testet die langfristige Planungsfähigkeit von Modellen, indem er den Betrieb eines Automatengeschäfts simuliert. Die Ergebnisse zeigen, dass Gemini 3 Pro während eines Jahres der simulierten Betriebszeit eine stabile Werkzeugnutzung und Entscheidungslogik aufrechterhalten hat, ohne vom Aufgabenziel abzuweichen und dabei höhere Gewinne erzielt hat.
Dies bedeutet, dass Gemini 3 Benutzern bei alltäglichen Aufgaben wie der Buchung von lokalen Dienstleistungen oder der Organisation des Posteingangs helfen kann.
03.
Ein neues Agent-Entwicklungsportal wird vorgestellt
End-to-End-Softwareentwicklung wird automatisiert
Heute hat Google ein neues Agent-Entwicklungsportal namens Google Antigravity vorgestellt.
Mithilfe der fortschrittlichen Inferenz-, Werkzeugnutzungs- und Agent-Programmierfähigkeiten von Gemini 3 wird Google Antigravity die KI-Unterstützung nicht nur als ein Werkzeug in den Entwicklerwerkzeugen, sondern als ein aktiver Partner darstellen.
Obwohl das Herzstück von Google Antigravity immer noch die KI-Integrated Development Environment (KI-IDE) ist, hat sich der Agent auf eine eigene Oberfläche verlagert und hat direkten Zugang zum Editor, Terminal und Browser. Jetzt können diese Agenten autonom komplexe End-to-End-Softwareaufgaben planen und ausführen und gleichzeitig ihren