StartseiteArtikel

Hört auf zu streiten, lasst es mich machen: Gemini 3 generiert alles.

果壳2025-11-19 08:06
Das einzige, was die Kluft zwischen Menschen auseinanderziehen kann, ist die Vorstellungskraft.

Endlich, nachdem es die Menschen lange in Atempause hielt, ist gestern Abend Gemini 3 online gegangen. Mit beinahe schrecklicher Stärke hat es alle anderen Modelle in den Schatten gestellt.

Mit nur einem Satz kann es 3D-Modelle erstellen, Websites entwickeln und sogar ein Open-World-Spiel erstellen...

Jetzt können Sie, indem Sie Google AI Studio besuchen, direkt die Vorschauversion von Gemini 3 Pro testen. Die für die breite Öffentlichkeit zugängliche Gemini-Website und die App werden ebenfalls bald online gehen.

Ich ziele nicht auf jemanden im Besonderen ab, ich meine alle hier anwesenden...

Gemini 3 Pro hat seine Leistung gezeigt. Es hat nicht nur sein Vorgänger-Modell Gemini 2.5 Pro übertroffen, sondern auch Claude Sonnet 4.5 und GPT-5.1 in allen Kategorien außer "Lösen echter GitHub-Probleme (SWE-Bench Verified)" geschlagen.

Das ist so, als käme in eine Klasse, in der es einige Schüler gibt, die in Mathematik, Sprache oder Fremdsprachen besonders gut sind, ein Alleskönner, der in allen Fächern die volle Punktzahl bekommt. Frustrierend, nicht wahr? Und beängstigend?

Es gibt einige Punkte in der Leistungstabelle des "Klassenkönigs", die besonders beachtenswert sind.

Bei ARC-AGI-2 hat Gemini 3 Pro mit 31,1 % einen deutlichen Vorsprung vor dem zweiten Platzierenden, Claude Sonnet 4.5. Dies ist ein schwieriger Test zur Überprüfung der abstrakten logischen Fähigkeiten von KI-Systemen und gilt als wichtiges Kriterium für die Bewertung des Niveaus der allgemeinen Künstlichen Intelligenz.

AIME 2025 und MathArena Apex repräsentieren die Fähigkeit, mathematische Probleme zu lösen. Bei MathArena Apex hat Gemini 3 Pro 23,4 % erreicht. Auch wenn der Anteil nicht hoch scheint, haben die Konkurrenten weniger als 2 %, was möglicherweise daran liegt, dass sie die Aufgaben nicht einmal verstehen.

Die Kategorien ScreenSpot-Pro und Vending-Bench 2 sind besonders interessant. Die erste dient zur Bewertung, ob eine KI eine Benutzeroberfläche verstehen und damit interagieren kann, wie es ein Mensch tun würde. Die zweite misst die Fähigkeit der KI, komplexe, langfristige Aufgaben und Aufgaben in verschiedenen Szenarien auszuführen.

Um es anders auszudrücken: Gemini ist das, was Siri schon immer werden wollte.

Nehmen wir an, Ihr Chef verschiebt eine Besprechung kurzfristig auf den Abend, und Sie befürchten, dass Sie danach nicht mehr zur Aufführung Ihrer Tochter kommen können. Wenn Sie dann die KI fragen, ruft sie verschiedene Daten von Ihrem Smartphone ab, wie die Endzeit der Besprechung, die Zeit der Aufführung in Ihrem Kalender und die Verkehrssituation zu dieser Zeit, und entscheidet, ob Sie es schaffen werden, pünktlich zu sein.

Während die anderen noch seit zwei Jahren in der "Vorbereitungsphase" stecken, bietet Google Ihnen jetzt direkt die fertige Lösung.

Wenn Sie im Google-Ökosystem den Gemini-Agent-Modus aktivieren und Gemini die erforderlichen Berechtigungen erteilen, kann es die Daten auf Ihren verschiedenen Google-Geräten nutzen und Ihnen helfen, die oben genannten Szenarien umzusetzen.

Zum Beispiel können Sie Gemini sagen: "Buch mir auf der Grundlage der Informationen in meinen E-Mails einen mittelgroßen SUV für meine Reise nächste Woche. Die Mietgebühr sollte nicht mehr als 80 US-Dollar pro Tag betragen." Dann können Sie nach der Landung direkt den Mietwagen abholen.

Auch in der Kategorie "Humanity's Last Exam", die als "letzter schriftlicher Test für den Menschen" bezeichnet wird, hat es mit 37,5 % die bisher höchste Punktzahl erreicht, weit vor dem zweiten Platzierenden, GPT-5.1, das nur 26,5 % erreicht hat.

Das bedeutet, dass Gemini 3 Pro derzeit das Modell ist, das am nächsten an einem "Alleskönner" für Menschen kommt.

Das ist aber noch nicht alles. Wenn der Deep-Think-Modus (Tiefgründiges-Denken-Modus) von Gemini 3 aktiviert wird, kann es in der "Humanity's Last Exam" auch ohne Hilfsmittel die Punktzahl auf 41 % steigern. Darüber hinaus hat es bei komplexen wissenschaftlichen Problemen, die strenge Logik und fachliche Kenntnisse erfordern (GPQA Diamond), beeindruckende 93,8 % erreicht.

Beim oben genannten ARC-AGI-2 hat Gemini 3 Deep Think sogar 45,1 % erreicht und damit sein Vorgänger-Modell Gemini 2.5 Pro, das nur 4,9 % erreicht hat, platt gemacht.

Designer sind in Gefahr

In der Vergangenheit musste, um eine App oder Website zu entwickeln, zunächst ein Designer die Benutzeroberfläche und die verschiedenen Grafiken erstellen. Dann musste ein Programmierer den Code schreiben, um diese Elemente einzubinden und schließlich ein interaktives Produkt zu veröffentlichen.

Jetzt kann man mit einem einfachen Satz von Gemini hochwertige interaktive SVG-Dateien erstellen lassen. Zum Beispiel das auf X (früher Twitter) beliebte "Ventilator"-Beispiel. Das Bild ist nicht nur schön, sondern auch animiert und interaktiv, so dass es direkt verwendet werden kann.

Darüber hinaus hat ein Nutzer von Gemini einen "Plumber" aus einem Spiel zeichnen lassen;

einen Fünfzylinder-Motor...

Ich habe auch versucht, von Gemini eine Glühbirne zeichnen zu lassen und ihr einen bedienbaren Schalter hinzugefügt. Es hat mir das in nur 35 Sekunden erledigt;

und es hat auch mein Hauskatze ziemlich gut nachgestellt.

Interaktive SVG-Dateien sind nicht nur für Spaß da. Sie haben größere Bedeutung und Ambitionen.

Google hat angekündigt, dass sie auf der Grundlage der starken logischen Fähigkeiten und Multimodalität von Gemini 3 in der kommenden Gemini-App eine neue Funktion namens "Generative UI" einführen werden.

Einfach ausgedrückt, kann die zukünftige Gemini-App direkt mit einer interaktiven Benutzeroberfläche auf Ihre Fragen antworten und auf Ihre Befehle reagieren. Es wird nicht mehr die alte Form der Interaktion mit großen Sprachmodellen sein, bei der es nur um "Frage-Antwort" geht.

Zum Beispiel kann, wie im offiziellen Google-Beispiel, wenn Sie Gemini bitten, Ihnen einen dreitägigen Urlaub in Rom nächsten Sommer zu planen, es eine dynamische, zeitschriftähnliche Ausgabe generieren. Sie können nicht nur die Informationen durchlesen, sondern auch mit den Elementen darin interagieren.

Diese Multimodalität ist wahrscheinlich auch der Grund, warum Google behauptet, dass man mit Gemini alles "bauen" kann.

(Einige) Programmierer sind wieder in noch größerer Gefahr...

In gewisser Weise ist das Zeichnen von SVG-Dateien auch eine Form des Programmierens. Und wenn es um Programmierung geht, ist das das Stärkespiel von Gemini.

Laut Tests von Nutzern auf X hat Gemini 3 Pro in mehreren Kategorien von DesignArena einen deutlichen Vorsprung.

Jetzt kann man mit einer relativ kurzen Beschreibung von Gemini 3 ein "macOS-Betriebssystem" erstellen lassen. Wenn man es ausführt, durchläuft es den "Startvorgang", und das Interessanteste ist, dass man auch im von ihm erstellten "macOS" im Internet surfen und Terminals ausführen kann...

Das ist noch relativ einfach. Ein Nutzer hat von Gemini 3 ein "Minecraft"-Spiel erstellen lassen, und es sieht ziemlich gut aus.

Ich habe es selbst getestet. Ich habe Gemini gebeten, mir eine persönliche Website zu erstellen, die vier Seiten haben soll: Startseite, Persönliche Einführung, Werke und Kontaktinformationen. Der Stil sollte modern, minimalistisch und elegant sein.

Gemini hat es in nur anderthalb Minuten erledigt. Die Navigationsleiste hat den gleichen Mattglasstil wie die von Apple, und auch die Buttons und Eingabefelder funktionieren und sind nicht nur dekorativ.

Die generierte Website ist bisher noch relativ mittelmäßig.

Also habe ich es gebeten: "Ich möchte einen Stil wie bei den weltweit besten Designstudios. Die Farben und die Layouts können kühner sein."

45 Sekunden später war ich von der Leistung von Gemini 3 Pro beeindruckt.

Und ein Design zu kopieren, ist für es kein Problem.

Ich habe auch noch etwas Unglaubliches gesehen: Ein Nutzer auf X hat von Gemini 3 einen 3D-Lego-Editor erstellen lassen, der die Benutzeroberfläche, den Code und alle erforderlichen Funktionen in einem Zug umgesetzt hat.

<