Warum wird das Gemini - Erlebnis zunehmend frustrierend? Gute KI wird bei Nutzung teurer, kostenlose KI senkt kollektiv ihre Intelligenz

Veröffentliche einen starken Start und verwende anhaltende Intelligenzminderung.

In letzter Zeit, wenn man nur die Google-Werbematerialien liest, hat man wahrscheinlich das Gefühl, dass Gemini fast unbesiegbar ist.

Was die Videoerstellung betrifft, gibt es Omni, für die Bildgenerierung Nano Banana. Die Leistung von Gemini 3.5 Flash ist sogar stärker als die von 3.1 Pro, und Gemini Spark kann Ihnen helfen, Aufgaben automatisch abzuschließen. Von der Pressekonferenz bis hin zum offiziellen Blog wirkt Gemini wie ein allumfassender Kämpfer, der in fast jeder Richtung Fortschritte macht.

Eigentlich hat die Lei Technology vor Kurzem auch bei der Berichterstattung über die Google I/O hoch Lob ausgesprochen. Aber nachdem ich es in letzter Zeit tatsächlich benutzt habe, denke ich immer mehr, dass Gemini 3.5 Flash etwas enttäuschend ist.

(Bildquelle: Google)

Es ist nicht so, dass es schlecht in Benchmarks abschneidet oder die schwächste Leistung hat. Im Gegenteil, viele seiner Fähigkeiten gehören immer noch zur Spitzengruppe der Branche.

Das Problem ist, dass, wenn die neuen Funktionen aus der Werbung in die tägliche Nutzung umgesetzt werden, es immer ein merkwürdiges Gefühl gibt. Man weiß, dass es stark ist, aber es fühlt sich nicht so gut an wie erwartet; man weiß, dass viele Funktionen bereits verfügbar sind, aber man hat das Gefühl, sie nicht wirklich nutzen zu können.

Diese Diskrepanz ist in der Welt der großen Sprachmodelle in letzter Zeit nicht ungewöhnlich: Die Hersteller zeigen die Höchstleistungen, die Benutzer erleben aber die tatsächliche Nutzung. Letztere verbessert sich nicht unbedingt im gleichen Maße wie die ersteren.

Und Gemini 3.5 Flash ist möglicherweise einer der deutlichsten Vertreter dieser Widersprüche. Es gibt so viele Kritikpunkte, dass man sie unbedingt loswerden muss.

Quota, Routing, Fähigkeiten: Die Nutzung wird noch kniffliger

Zuerst das Problem, das am leichtesten zu spüren ist.

Quota.

Google hat kurz vor der I/O 2026-Konferenz heimlich die Regeln für die Mitgliedschaftsabonnements geändert. Anstatt eine feste Anzahl von Nachrichten zu erlauben, basiert die Quota jetzt auf der Berechnungsressource (compute-based quota).

Einfach ausgedrückt, früher wurde bei Gemini nur die Anzahl der Interaktionen gezählt. Die Nutzungshäufigkeit der Bild-, Video-, Audio- und Textmodelle war unabhängig voneinander und wurde alle 24 Stunden zurückgesetzt.

Meiner Erfahrung nach kann ein Pro-Mitglied pro Tag fünf Videos und 50 Bilder generieren, und der Textplatz wird überhaupt nicht aufgebraucht.

(Bildquelle: Lei Technology)

Nach der Änderung hat Google sowohl eine wöchentliche Quota als auch eine temporäre Quota festgelegt, die alle fünf Stunden zurückgesetzt wird.

Jetzt wird der Verbrauch aller Aufgaben in Bezug auf die Token-Verwendung und andere Faktoren berechnet. Wenn man das Modell viel denken lässt, kostet es auch mehr, selbst wenn die Antwort des Modells gleich bleibt.

Das Problem ist, wie soll ich wissen, wie viel Rechenleistung eine Aufgabe für das Modell verbraucht?

(Bildquelle: Lei Technology)

Darüber hinaus sind alle zuvor getrennten Funktionen jetzt Teil dieser Quota. Egal, ob es sich um Videos, Bilder, tiefergehende Recherchen oder Agenten handelt, wenn eine Funktion die Quota aufbraucht, können Sie für die nächsten Stunden nichts mehr tun.

Nach meiner eigenen Erfahrung verbraucht die Erstellung eines Videos mit Omni Flash etwa ein Drittel der Pro-Abonnement-Quota. Wenn Sie das Video ändern möchten, benötigen Sie mindestens die Hälfte der Quota. Es reicht einfach nicht aus.

Was die Nutzung noch mehr beeinträchtigt, ist eigentlich das Routing-Problem.

Das ist nicht nur mein persönliches Empfinden. In letzter Zeit haben viele Benutzer ähnliche Probleme. Manchmal funktioniert die Bildgenerierung normal, aber plötzlich sagt Gemini, dass es keine Bilder generieren kann und dass es nur ein Textmodell ist und für solche Aufgaben nicht in der Lage ist.

(Bildquelle: Lei Technology)

Das lustigste ist, dass es sogar vorkommen kann, dass nur Text und kein Bild angezeigt wird.

(Bildquelle: Lei Technology)

Wenn so etwas gelegentlich passiert, kann man es verstehen. Aber wenn es zu oft vorkommt, ist es für die Benutzer wirklich schwierig, herauszufinden, ob die Funktion fehlgeschlagen ist oder ob das Modell falsch umgeschaltet wurde.

Ähnliche Probleme gibt es auch auf der Ebene der Fähigkeiten.

Gemini 3.5 Flash hat das Gefühl, dass es in der Lage ist, Aufgaben zu erledigen, aber es ist oft nicht stabil genug. Bei der gleichen Mathematikaufgabe oder Schlussfolgerungsaufgabe kann die Antwort manchmal sehr gut sein, aber wenn man dieselbe Frage ein paar Stunden später erneut stellt, kann das Ergebnis völlig unterschiedlich sein.

Ich habe einige klassische Logikaufgaben getestet. Oft ist der Analyseprozess am Anfang richtig und die Ableitungskette scheint vollständig zu sein, aber im letzten Schritt gibt es oft merkwürdige Fehler. Das Schlimmste ist, dass es sich sehr sicher ist, auch wenn die Antwort falsch ist.

Bei einfacheren Rechenaufgaben macht es auch weiterhin Fehler.

(Bildquelle: Lei Technology)

Ich weiß, dass solche Probleme für ein Chatgespräch nicht so wichtig sind, aber in Lern-, Arbeits- oder Programmierumgebungen kann der Einfluss ganz anders sein.

Werden gute KI-Systeme immer teurer?

Wenn die vorherigen Probleme auf der Ebene der Nutzung liegen, dann kommt das tiefere Problem eigentlich aus Googles neuem Produkt- und Preispolitik.

Meiner Meinung nach ist die Geschichte von Agenten das, was Google dieses Jahr am liebsten erzählt.

Von der Pressekonferenz bis hin zur offiziellen Werbung dreht sich fast alles um Gemini Spark. Automatische Recherche, Informationsorganisation, Aufgabenausführung und sogar die Durchführung von Operationen über verschiedene Anwendungen hinweg klingen wirklich zukunftsträchtig und entsprechen der Vorstellung von Agenten.

Das Problem ist, dass man für die Nutzung von Gemini Spark ein Ultra-Abonnement benötigt. Der Mindestpreis für dieses Abonnement beträgt 99,99 US-Dollar pro Monat, und der Sonderpreis für das höchste Abonnement beträgt 199,99 US-Dollar pro Monat (etwa 1.352,98 Yuan).

(Bildquelle: Lei Technology)

Man muss bedenken, dass man für OpenAI und den unschlagbaren Codex nur 20 US-Dollar pro Monat zahlen muss.

So kommt es zu einem interessanten Phänomen: Wenn man die Pressekonferenz sieht, hat man das Gefühl, dass Gemini unschlagbar ist. Aber wenn man das Produkt öffnet, sieht man zuerst den Button zum Upgraden.

Dieser Unterschied beeinflusst das Ruf des Produkts sogar stärker als das Fehlen von Funktionen. Denn die Benutzer wissen, dass die Fähigkeiten vorhanden sind und dass die Ergebnisse gut sind, aber sie können sie nicht nutzen.

Was die Preise für die Programmierung betrifft, sind sie auch nicht viel günstiger.

Man muss bedenken, dass Google-Chef Pichai auf der I/O 2026-Konferenz nicht wenig über die Kostenvorteile von Gemini 3.5 Flash gesprochen hat.

Nach den offiziellen Preisen kostet Gemini 3.5 Flash 1,5 US-Dollar pro Million eingegebener Token und 9 US-Dollar pro Million ausgegebener Token. Im Vergleich dazu kostet die API von Claude Opus 4.7 5 US-Dollar pro Million eingegebener Token, und GPT-5.5 Pro kostet sogar 30 US-Dollar pro Million eingegebener Token.

(Bildquelle: Lei Technology)

Wenn man sich nur die Preisliste ansieht, scheint es tatsächlich viel günstiger zu sein, und es hat sogar einen Hauch von Massenverkauf.

Aber die Preisliste ist nur eine Orientierung. Für diejenigen, die das Modell tatsächlich nutzen, ist es wichtiger, wie viel es kostet, eine bestimmte Aufgabe zu erledigen.

Artificial Analysis hat in einer Agenten-Bewertung festgestellt, dass die Kosten für die Durchführung einer gesamten Aufgabe mit Gemini 3.5 Flash über 1.500 US-Dollar betragen, während Gemini 3 Flash weniger als 300 US-Dollar kostet. Der Unterschied ist mehr als das Fünffache. Selbst im Vergleich zu Gemini 3.1 Pro ist die Gesamtkosten von Flash deutlich höher, und es ist sogar teurer als GPT-5.5.

(Bildquelle: Lei Technology)

Wo liegt das Problem?

Die Antwort ist einfach: Es redet zu viel.

In den Agenten-Tests benötigt Gemini 3.5 Flash durchschnittlich fast 50 Dialogrunden, um eine Aufgabe abzuschließen, während viele Konkurrenten schon nach etwa 20 Runden fertig sind. Man sollte nicht unterschätzen, wie wichtig diese Differenz von einigen Runden ist. Bei jedem neuen Dialog muss das Modell die vorherigen Gespräche erneut lesen, und je mehr Runden es gibt, desto schneller werden die Token verbraucht.

Das ist wie beim Taxifahren: Der Preis pro Kilometer ist zwar günstig, aber wenn man dreimal um die Stadt fährt, wird die Rechnung am Ende hoch. Die Benutzer sehen immer die Gesamtkosten, nicht den Anfangspreis.

Neuer Widerspruch in der KI: Starke Präsentation, schwache Nutzung

Letztendlich denke ich nicht, dass Gemini 3.5 Flash ein fehlgeschlagenes Modell ist.

Tatsächlich gehört es immer noch zur Spitzengruppe der Branche. Seine multimodalen Fähigkeiten sind immer noch stark, die Videoerstellung funktioniert gut, und die Such- und Integrationsfähigkeiten sind immer noch Googles Stärke. Viele einzelne Fähigkeiten sind im Vergleich zur gesamten Branche immer noch sehr beeindruckend.

Das Problem liegt in der zwangsweisen Reduzierung der Quota und den häufigen Leistungseinbußen aufgrund von Rechenleistungsmangel.

(Bildquelle: Lei Technology)

Egal wie Google es beworben hat, interessieren sich normale Benutzer nicht für die Ranglisten oder wie viel Rechenleistung Gemini 3.5 Flash spart. Sie interessieren sich dafür, ob sie Aufgaben erfolgreich abschließen können, ob die Ergebnisse stabil sind, ob sie keine komplizierten Regeln lernen müssen und sich keine Sorgen um die plötzliche Erschöpfung der Quota machen müssen

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Warum wird das Gemini-Erlebnis immer frustrierender? Gute KI wird mit der Nutzung teurer, und kostenlose KI verringert kollektiv ihre Intelligenz.

Quota, Routing, Fähigkeiten: Die Nutzung wird noch kniffliger

Werden gute KI-Systeme immer teurer?

Neuer Widerspruch in der KI: Starke Präsentation, schwache Nutzung