Google bringt den "Preisjäger" hervor: Gemini 3 Flash übertrifft Pro, kostet nur ein Viertel und ist so schnell wie "Blitz"
Nach einer Meldung von Zhidongxi vom 18. Dezember: Gestern Abend hat Google Gemini 3 Flash vorgestellt, das darauf abzielt, auf kostengünstigere Weise hochmoderne KI-Leistungen zu liefern.
Genauer gesagt kostet die Ausgabe von einer Million Tokens nur 20 % von Claude Sonnet 4.5 und 21 % von GPT-5.2, erreicht aber in Benchmarks die Leistung dieser Spitzenmodelle oder übertrifft sie sogar.
Selbst im Vergleich zu Gemini 3 Pro bietet Gemini 3 Flash ein hervorragendes Preis-Leistungs-Verhältnis. Flash kostet nur 25 % von Pro, übertrifft aber das Pro-Modell in den Kern-Benchmarks wie MMMU-Pro und SWE-bench Verified.
Die zuvor veröffentlichten Modelle der Gemini 3-Serie haben sich in komplexen logischen Schlüssen, Multimodalität und visuellem Verständnis, Agenten und Vibe Coding Aufgaben bewährt. Gemini 3 Flash baut auf diesen Stärken auf und kombiniert die Inferenzleistung von Gemini 3 Pro mit der geringen Latenz, Effizienz und Kosteneffizienz von Flash.
Der Chefwissenschaftler von Google, Jeff Dean, sagte: „Gemini 3 Flash ist nicht nur qualitativ besser als 2.5 Pro, sondern auch dreimal so schnell und kostet nur einen Bruchteil dessen.“ Hier ist eine Vergleichsdemonstration:
Gemini 3 Flash ist jetzt vollständig verfügbar. Entwickler können es über die Gemini API in Google AI Studio, die Gemini CLI und die Agenten-Entwicklungsplattform Google Antigravity nutzen. Normale Benutzer können es über die Gemini-Anwendung und die KI-Funktion in Google Search verwenden.
01. Entworfen für iterative Entwicklung und ermöglicht „Mundprogrammierung“
Was kann eigentlich Gemini 3 Flash? Google sagt, es ist ein Modell, das speziell für iterative Entwicklung konzipiert ist und nahezu die gleiche Programmierleistung wie Gemini 3 Pro bei geringer Latenz bietet.
Google hat mehrere Beispiele geteilt. Beispielsweise kann Gemini 3 Flash in einem „Pinball-Rätselspiel“ mit Handverfolgung multimodale Schlussfolgerungen ziehen und fast Echtzeit-KI-Unterstützung bieten.
Es kann auch nahezu in Echtzeit neue Ladeanimationen entwerfen und A/B-Tests durchführen, was den Prozess von der Entwurfsphase bis zum Code vereinfacht.
Mithilfe multimodaler Schlussfolgerungen kann Gemini 3 Flash Bilder mit kontextuellen UI-Überlagerungen schnell analysieren, Untertitel generieren und statische Bilder in interaktive Erlebnisse verwandeln.
Aufgrund seiner hervorragenden Leistung in Schlussfolgerungen, Werkzeuggebrauch und Multimodalität eignet sich Gemini 3 Flash besonders für Entwickler, die komplexere Videoanalysen, Datenextraktionen und visuelle Fragen beantworten möchten.
Die multimodalen Schlussfolgerungsfähigkeiten von Gemini 3 Flash können verwendet werden, um Benutzern zu helfen, alle Arten von Informationen zu sehen, zu hören und zu verstehen. Benutzer können Gemini bitten, Videos und Bilder zu verstehen und innerhalb von Sekunden daraus hilfreiche und umsetzbare Pläne zu entwickeln.
Die Gemini 3 Flash in der Gemini-Anwendung kann Kurzvideoinhalte analysieren und Ihnen einen Plan geben, wie Sie Ihren Golfschwung verbessern können.
Da Gemini 3 Flash auf Geschwindigkeit optimiert ist, kann es schon während Sie zeichnen „sehen“ und erraten, was Sie zeichnen.
Sie können eine Audioaufzeichnung hochladen. Gemini 3 Flash wird Ihre Wissenslücken identifizieren, einen benutzerdefinierten Test erstellen und die Antworten ausführlich erklären.
Oder Sie können versuchen, „mit der Stimme zu programmieren“ und allein mit Sprachinput interessante und nützliche Anwendungen von Grund auf aufbauen. Gemini 3 Flash kann in wenigen Minuten unstrukturierte Ideen in eine funktionierende Anwendung umwandeln.
02. Übertrifft Pro-Modelle in vielen Bereichen und kann die Denkintensität selbst anpassen
Wie hat sich Gemini 3 Flash in Benchmarks bewährt? In Doktoratsniveau-Logik- und Wissens-Benchmarks wie GPQA Diamond (90,4 %) und Humanity's Last Exam (33,7 % ohne Werkzeuge) kann es mit größeren Spitzenmodellen mithalten und übertrifft in vielen Benchmarks deutlich Gemini 2.5 Pro.
In dem Benchmark SWE-bench Verified, der die Fähigkeiten von Coding-Agenten misst, hat Gemini 3 Flash 78 % erreicht und übertrifft nicht nur die 2.5-Serie, sondern auch Gemini 3 Pro.
Es hat auch in MMMU Pro 81,2 % erreicht, was mit der Leistung von Gemini 3 Pro vergleichbar ist und den neuesten Stand der Technik darstellt.
In den im folgenden Bild gezeigten Benchmarks hat Gemini 3 Flash fast alle anderen Modelle wie Claude Sonnet 4.5 und Gemini 2.5 Pro übertroffen.
Abgesehen von seinen Spitzenleistungen in logischen Schlüssen und Multimodalität ist Gemini 3 Flash für hohe Effizienz konzipiert und erweitert die Pareto-Grenze zwischen Qualität, Kosten und Geschwindigkeit. Das folgende Streudiagramm zeigt die Beziehung zwischen den LMArena Elo-Scores mehrerer Sprachmodelle und den Kosten pro Million Tokens. Eine Linie markiert die Pareto-Grenze, die durch Gemini 3 Pro, Gemini 3 Flash und Gemini 3 Flash Lite verläuft.
Wenn das Denkbudget auf das Maximum eingestellt ist, kann Gemini 3 Flash seine Denkleistung anpassen. Bei komplexeren Anwendungen kann es länger überlegen. Gemäß typischen Traffic-Messungen verbraucht es im Durchschnitt 30 % weniger Tokens als 2.5 Pro, während es alltägliche Aufgaben mit höherer Leistung und Genauigkeit erledigt.
03. Fazit: Das Gemini 3-Modellportfolio wird vervollständigt und kann tief in alltägliche Anwendungen integriert werden
Die Modelle der Gemini 3-Serie wurden seit ihrer Veröffentlichung sehr gut aufgenommen, aber die hohen Kosten haben viele Benutzer abgeschreckt. Gemini 3 Flash vervollständigt das Gemini 3-Portfolio in Bezug auf Leichtigkeit und Kosteneffizienz und erfüllt die Ansprüche von Entwicklern in der realen Produktionsumgebung.
Von iterativer Entwicklung und Vibe Coding bis hin zu multimodalen Anwendungen, Echtzeitinteraktionen und Agentensystemen bietet Gemini 3 Flash ein besseres Preis-Leistungs-Verhältnis und kann dazu beitragen, dass KI breiter in alltägliche Anwendungen und Geschäftssysteme integriert wird.
Dieser Artikel stammt aus dem WeChat-Account „Zhidongxi“ (ID: zhidxcom). Autor: Chen Junda, Redakteur: Li Shuiqing. Veröffentlicht von 36 Kr mit Genehmigung.