StartseiteArtikel

Das kleine Glas Gemini schlägt GPT 5.2 und simuliert das Windows-Betriebssystem in einer Minute.

量子位2025-12-18 16:06
Hier kommt die praktische Testung von Gemini 3 Flash!

Google hat Gemini 3 Flash vorgestellt und zeigt der KI-Branche, was es heißt: Kinder wählen, Erwachsene nehmen alles (doge).

Eine Formel, um dieses neue Modell zu beschreiben: Gemini 3 Flash = Pro-Smartheit + Flash-Geschwindigkeit + niedrigere Preise.

Was die Geschwindigkeit betrifft, ist es fast dreimal so schnell wie Gemini 2.5 Pro. In der Praxis ist es sogar so reibungslos, dass es wie in die Luft fliegt:

Was die Intelligenz betrifft, hat es in mehreren klassischen Tests eine Reihe führender Modelle, darunter Gemini 3 Pro und GPT5.2, besiegt.

Bei der Aufgabe, die Anzahl der Finger in einem Bild zu zählen, sagte GPT5.2 sofort "5", während Gemini 3 Flash die Falle erkannt und die richtige Antwort "6" gegeben hat.

Beim Zeichnen eines radfahrenden Pelikans hat Gemini 3 Flash (oben rechts) deutlich bessere Ergebnisse erzielt als Gemini 2.5 Pro (links) und Gemini 3 Pro (unten rechts). Und das sind alle die besten Ergebnisse nach wiederholten Tests.

Im Abschnitt, in dem die Beobachtungsgabe getestet wird, soll das Modell erkennen, wer "Google's Propagandasekretär" Logan Kilpatrick ist.

Gemini 3 Flash hat als erstes die richtige Antwort gegeben, während Gemini 3 Pro ihn mit Jack Krawczyk, dem ehemaligen Leiter von Gemini (der im April dieses Jahres wechselte und zu Meta wechselte), verwechselt hat.

In weiteren Tests hat Gemini 3 Flash seine beeindruckende Gesamtsleistung gezeigt.

Trotz des Namens "Flash" ist es das leistungsfähigste KI-Modell von Google bisher

Wichtig: Dieses Modell wird ab sofort weltweit allen Benutzern zur Verfügung gestellt:

Normale Benutzer können es über die Gemini-App und die KI-Funktion von Google Search nutzen; professionelle Entwickler können es über die Gemini-API in Google AI Studio, Gemini CLI und der neuen KI-Entwicklungsplattform Google Antigravity aufrufen und integrieren.

Außerdem können Unternehmenskunden über die Plattformen Vertex AI und Gemini Enterprise Zugang zu den Dienstleistungen erhalten.

Insgesamt hat Gemini 3 Flash die Fähigkeiten zur komplexen Inferenz, Multimodalität und visuellen Verständnis, Vibe-Programmierung sowie die Fähigkeit, Agentenaufgaben zu bearbeiten von Gemini 3 Pro übernommen, nur dass es noch schneller antwortet.

Google hat offiziell erklärt, dass es das "beste Modell für Agentenworkflows" bisher ist.

Ohne weitere Worte, schauen wir uns an, was Gemini 3 Flash kann und wie es sich in der Praxis verhält.

Zum Beispiel, wenn man es auffordert, ein voll funktionsfähiges und ansprechendes Windows-Betriebssystem zu erstellen, dauert der Kernprozess weniger als eine Minute (Video nicht beschleunigt).

Ein Nutzer, der diesen Test geteilt hat, sagte: "Dies ist ein atemberaubendes Modell."

Es kann auch direkt Spiele generieren. Ein Nutzer hat den folgenden Prompt verwendet:

Erstelle mit Code ein Spiel "Grand Theft Auto 6" und mache es so realistisch wie möglich. Füge beliebige Funktionen hinzu.

Das Spiel hat schon einen guten Eindruck, aber das Bild hat noch Potential zur Verbesserung.

Bei einfachen Spielen funktioniert es jedoch ziemlich gut.

Und wenn man es auffordert, eine Wetterkarte zu generieren, sieht es so aus:

Man kann mit bloßem Auge erkennen, dass das Design anspruchsvoller und die Interaktion reichhaltiger ist.

Zum Schluss haben wir es getestet und es aufgefordert, eine eigene Präsentationswebsite zu erstellen.

Bei der praktischen Test hat sich gezeigt, dass die Geschwindigkeitstestfunktion auf der Website funktioniert und es nicht nur ein "Husarenrock" mit einem schönen Frontend ist:

Außerdem kann man tatsächlich zur offiziellen Gemini-Website gelangen, wenn man auf die Schaltfläche "Jetzt testen" klickt.

Nach all diesen Tests, wie schätzt du die Leistung von Gemini 3 Flash ein?

Leistung und Geschwindigkeit übertreffen 2.5 Pro, die Preise sind jedoch viel niedriger

Außerdem zeigt die offizielle Bewertung, dass Gemini 3 Flash vor allem "schnell und intelligent" ist.

Es übertrifft nicht nur deutlich Gemini 2.5 Pro in der Leistung, sondern auch in professionellen Multimodal-Tests wie MMMU Pro und komplexen Inferenztests wie ARC-AGI-2, kann es sogar Gemini 3 Pro in einigen Aspekten übertreffen.

Was noch wichtiger ist, hat es die Pareto-Grenze in Bezug auf Leistung, Kosten und Geschwindigkeit überschritten - es ist dreimal so schnell wie Gemini 2.5 Pro, verbraucht aber durchschnittlich 30 % weniger Token.

Was die Preise betrifft, ist Gemini 3 Flash kostengünstiger als die früheren Modelle.

Es kostet 0,5 US-Dollar pro Million eingegebener Token und 3 US-Dollar pro Million ausgegebener Token (der Preis für Audioeingabe beträgt weiterhin 1 US-Dollar pro Million eingegebener Token).

Obwohl es etwas teurer ist als Gemini 2.5 Flash (0,3 US-Dollar pro Million Eingabe / 2,5 US-Dollar pro Million Ausgabe), ist der Preis angesichts seiner Leistung und Geschwindigkeit immer noch sehr attraktiv.

(Gemini 2.5 Pro kostet 1,25 US-Dollar pro Million Eingabe / 10 US-Dollar pro Million Ausgabe.)

Jetzt hat Google mit Gemini 3 alle Mitglieder seiner Familie zusammengebracht, einschließlich des früheren Pro-Modells und der Deep Think-Version.

Was die Denkmodi betrifft, hat Gemini 3 Flash laut Entwicklerdokumentation insgesamt vier Stufen - minimal, low, medium, high.

Wenn man sich die Entwicklung der Bildqualität ansieht, versteht man sofort den Unterschied zwischen diesen Stufen (doge):

One More Thing

Interessanterweise hat Google direkt nach der Veröffentlichung von Gemini 3 Flash eine Live-Show von "Pokémon: Crystal Version" gestartet.

Die beiden Teilnehmer sind Gemini 3 Flash und Gemini 3 Pro.

Obwohl das Endergebnis noch nicht feststeht, führt Gemini 3 Pro vorerst an.

Einige Nutzer haben überraschend festgestellt, dass Gemini 3 Pro in diesem Spiel bereits eine gewisse systemweite Denkfähigkeit gezeigt hat.

Interessierte können auf das Endergebnis warten und vielleicht auf eine Überraschung hoffen.

Referenzlinks:

[1]https://x.com/OfficialLoganK/status/2001428651121025391?s=20

[2]https://x.com/simonw/status/2001424152763470238?s=2

[3]https://blog.google/products/gemini/gemini-3-flash/

Dieser Artikel stammt aus dem WeChat-Account