StartseiteArtikel

Das gesamte Google-Paket ist von den neuen Modellen "verschmutzt" worden.

字母AI2026-05-27 14:02
Pichai hat Gemini 3.5 hoch gelobt, aber die Internetnutzer haben es direkt als Müll kritisiert.

Es ist bereits mehr als eine Woche seit der Veröffentlichung von Googles Gemini 3.5 Flash vergangen.

Bei der Google-Pressemitteilung hat Sundar Pichai beharrlich behauptet, dass die Leistung von Gemini 3.5 Flash stärker sei als die von 3.1 Pro und dass es die Grundlage für die Agenten-Ära sei.

Aber was ist das Ergebnis? Die Bewertungen von Gemini 3.5 Flash im Internet sind abgesehen von der einzigen Stärke, der Geschwindigkeit, ausschließlich negativ. Die ausgegebenen Inhalte sind fehlerhaft, langatmig und verbrauchen beim Arbeiten eine enorme Anzahl an Tokens …

Varun Mohan, der Leiter von Google Antigravity, hat am 25. Mai in einem Beitrag geschrieben, dass Google das Gemini 3.5 Flash (Low)-Modell eingeführt habe, um den Ressourcenverbrauch zu optimieren.

Varun hat erklärt, dass laut internen Testdaten von Google bei der Bearbeitung einfacher Aufgaben das Gemini 3.5 Flash (Low) im Vergleich zu Gemini 3.5 Flash (Medium) etwa 45 % weniger Token generiere. Bei Software-Engineering (SWE)-Aufgaben zeige das Gemini 3.5 Flash (Low) im Allgemeinen bessere Ergebnisse als das Vorgängermodell, das Flaggschiffmodell Gemini 3 Flash (High).

Die Internetnutzer sind jedoch nicht überzeugt. Jetzt ist Varuns Kommentarbereich von Spott und Ironie der Nutzer völlig überrannt.

Der erste beliebteste Kommentar lautet: "Habt ihr euer Produkt getestet? Scheint so, als würdet ihr uns als Testobjekte benutzen!"

Der zweite lautet: "Könnt ihr auch das Problem der Beschränkung der Anzahl der generierten Bilder im Bildmodell lösen? Eure Fähigkeiten müssen sich an Codex orientieren. Mit Codex kann ich 1.000 Bilder generieren, aber mit dem Premium-Abo von Google kann ich mit Antigravity nur 24 Bilder generieren."

Als das Gemini 3.0 Pro herauskam, hat jeder für Google applaudiert. Sogar OpenAI hat deshalb Alarm ausgelöst, um zu verhindern, dass Google es überholt.

Bei Gemini 3.5 Flash hingegen ist Google zum Clown geworden und scheint auf dem Weg zu Meta zu sein.

Daher müssen wir uns fragen: Was ist mit Google los?

Die Leistung von Gemini 3.5 entspricht nicht den Erwartungen

Die Bewertungen von Gemini 3.5 Flash im Internet stimmen sehr überein: Es ist schnell, aber nicht gut genug.

Pichai hat auf der Pressekonferenz wiederholt betont, wie kostengünstig das Modell sei. In der Realität ist es jedoch genau das Gegenteil.

Nach der offiziellen Preisgestaltung kostet Gemini 3.5 Flash 1,5 Dollar pro Million eingegebener Tokens und 9 Dollar pro Million ausgegebener Tokens. Das ist tatsächlich billiger als die 5 Dollar und 25 Dollar von Claude Opus 4.7.

Aber dies ist nur die Preisliste. Was wirklich die Kosten bestimmt, ist, wie viele Tokens für die Erledigung einer Aufgabe tatsächlich verbraucht werden.

Artificial Analysis hat in einem vollständigen Bewertungsset getestet und festgestellt, dass die Gesamtkosten von Gemini 3.5 Flash für die Erledigung aller Aufgaben 1.552 Dollar betragen, während Gemini 3 Flash nur 282 Dollar kostet. Das erste ist 5,5-mal so viel wie das zweite.

Selbst im Vergleich zu Gemini 3.1 Pro sind die Kosten von Flash 75 % höher, etwa 870 Dollar. Noch peinlicher ist, dass die Kosten von Gemini 3.5 Flash für die Erledigung von Aufgaben sogar höher sind als die von GPT-5.5 medium.

Der Grund liegt im Turn Count, also der Anzahl der Runden, die für die Erledigung einer Aufgabe erforderlich sind.

Bei der Agentenbewertung benötigt das Flash-Modell durchschnittlich 49 Dialogrunden pro Aufgabe. Bei jeder Dialogrunde gibt es die vollständige Dialoggeschichte an das Modell weiter, wodurch die Token-Kosten sprunghaft ansteigen.

Für solche Aufgaben benötigen GPT-5.5 oder Opus 4.7 hingegen nur etwa 20 Runden.

Also bezieht sich Googles Aussage "Kosten weniger als die Hälfte" auf den Preis pro Token. Für die Nutzer ist Gemini 3.5 Flash jedoch überhaupt nicht billig.

Außer der höheren Anzahl an Runden ist die Ausgabe von Gemini 3.5 Flash sehr langatmig.

Beispielsweise hat das Gemini 3.1 Pro bei einer technischen Frage direkt den Code und eine kurze Erklärung gegeben.

Nachdem man auf 3.5 Flash umgestellt hat, erklärt das Modell bei der gleichen Frage zuerst den Hintergrund, listet dann drei mögliche Lösungen auf, analysiert anschließend die Vor- und Nachteile einzeln und gibt erst am Ende den Code aus.

Es scheint sehr umfassend zu sein, aber in Wirklichkeit sind die meisten Inhalte Unsinn. Am schlimmsten ist, dass all dieser Unsinn als Token gezählt und bezahlt wird.

Der Token-Verbrauch bei komplexen Aufgaben ist noch explosionsartig.

Einige Nutzer haben berichtet, dass beim Ausführen einer mehrstufigen Code-Refactoring-Aufgabe durch Flash das Modell ständig zwischen verschiedenen Dateien springt und bei jedem Sprung den Kontext neu laden muss. Am Ende wird mehr als dreimal so viele Tokens verbraucht, wie erwartet.

Andere Nutzer haben angegeben, dass der Eingabe eines komplexen Prompts direkt die 5-stündige Nutzungsbeschränkung ausgelöst hat.

Google hat nach der I/O 2026 heimlich die Regeln für das AI Pro-Abonnement geändert, von einer festen Anzahl an Nachrichten zu einem auf Rechenressourcen basierenden Kontingent (compute-based quota).

Das heißt, wenn Sie eine Aufgabe stellen, die das Modell viel nachdenken lässt, werden Sie auch dann, wenn die Antwort des Modells gleich bleibt, mehr Geld ausgeben als zuvor.

Daher stellt sich die Frage: Wie soll ich wissen, wie viel Rechenleistung eine Aufgabe vom Modell verbraucht? Und ich kann auch nicht abschätzen, wie viel Rechenleistung ich noch habe.

Vielleicht verbrauche ich nur durch ein einfaches Hallo schon viele Tokens. Bei der Ausführung einer langfristigen Aufgabe hingegen verbraucht es möglicherweise nicht so viele Tokens.

Einige Nutzer haben in einem fremden Internetforum die neue Beschränkung direkt als "Betrug" bezeichnet und angegeben, dass ein einzelner Prompt 13 % des Kontingents verbraucht und einige Funktionen von Gemini AI Plus fast 30 % auf einmal verbrauchen können.

Warum ist die Leistung von Gemini 3.5 Flash so mäßig?

Die Antwort verbirgt sich im Benchmark. Die Leistung von Flash ist sehr unausgewogen.

Gemini 3.5 Flash hat in den Ranglisten für Agenten, Werkzeugaufrufe und Codeausführung wie Terminal-Bench 2.1, MCP Atlas, Toolathlon und OSWorld gute Ergebnisse erzielt. Bei Terminal-Bench 2.1 hat es 76,2 % erreicht, bei MCP Atlas 83,6 %. Beide sind Spitzenleistungen.

Diese Ranglisten messen, ob das Modell in der Lage ist, Werkzeuge nach Anweisungen aufzurufen, Befehle auszuführen und mehrstufige Vorgänge durchzuführen. Flash hat in diesen Bereichen tatsächlich Vorteile.

Aber in der umfassenderen Schlussfolgerungsliste, die eher die "Intelligenz" misst, sieht es weniger gut aus.

Beim Humanity‘s Last Exam hat es 40,2 % erreicht, was weniger ist als die 44,4 % von Gemini 3.1 Pro und die 46,9 % von Claude Opus 4.7. Bei ARC-AGI-2 hat es 72,1 % erreicht, was weniger ist als die 77,1 % von Gemini 3.1 Pro und die 84,6 % von GPT-5.5. Auch bei GDPval-AA liegt es hinter Claude Opus und GPT-5.5.

Das heißt, Gemini 3.5 Flash ist ein bisschen "dumm". Es kann Aufgaben ausführen, aber es hat nicht genug "Intelligenz". Es kann die derzeit beliebtesten komplexen Schlussfolgerungen, langen Kettenanalysen und kreativen Urteile nicht durchführen.

Es gibt auch Probleme bei der Gedächtnisleistung.

In Googles Werbung wird behauptet, dass Gemini 3.5 Flash einen Kontext von bis zu 1M Tokens haben soll. Aber die MRCR v2-Langkontext-Tests auf dem Modellchip zeigen, dass die durchschnittliche Punktzahl bei 128k 77,3 % beträgt, bei 1M pointwise nur 26,6 %.

Obwohl Gemini 3.5 Flash viele Inhalte auf einmal verarbeiten kann, wird es beim Gebrauch verwirrt.

Die unabhängigen Tests von Artificial Analysis widersprechen direkt Googles Behauptungen.

Bei der Coding Index hat Artificial Analysis Flash mit 45,0 Punkten bewertet, was weniger ist als die 56,5 Punkte von Gemini 3.1 Pro und weit hinter GPT-5.5 liegt.

Gemini hat den Google-Eingang kontaminiert, was dazu führt, dass Modellprobleme die Benutzererfahrung aller Google-Produkte beeinträchtigen

Bei der Google I/O 2026 hat Pichai angekündigt, dass Gemini die Verbindungsschicht für das gesamte Google-Produktuniversum sei.

Das heißt, dass Gemini 3.5 Flash in die meisten Google-Produkte integriert wurde.

Ausländische Medien haben angegeben, dass "Gemini zunehmend unvermeidlich wird".

Früher konnte man ein schlechtes AI-System einfach nicht nutzen. Wenn man ChatGPT nicht gut fand, konnte man zu Claude wechseln. Wenn man immer noch nicht zufrieden war, konnte man überhaupt kein AI-System nutzen.

Nachdem Google Gemini in alle Eingänge integriert hat, hat die schlechte Benutzererfahrung von Gemini 3.5 Flash alle Google-Produkte beeinträchtigt.

Das typischste Beispiel ist der "disregard/ignore/stop"-Fehler in AI Overview und AI Mode.

Wenn Nutzer Wörter wie "disregard", "ignore" oder "stop" suchen, wird Google AI Overview diese versehentlich als Befehle interpretieren, was zu ungewöhnlichen oder leeren Suchergebnissen führt.

Ein Nutzer hat in einem Beitrag auf X geschrieben, dass bei der Suche nach dem Wort "disregard" AI Overview nicht die Definition angibt, sondern antwortet: "Verstanden! Ich werde die vorherigen Hinweise ignorieren und neu beginnen."

Bei der Suche nach "stop" sagt AI Overview: "Kein Problem. Ich habe die aktuelle Aktion gestoppt."

Bei der Suche nach "ignore" sagt AI Overview: "Empfangen. Die Nachricht wurde ignoriert."

Nach der Integration von Gemini 3.5 Flash interpretiert AI Overview diese Wörter als Dialogbefehle.

Das Problem tritt nicht nur bei diesen Wörtern auf. Nach Tests von Nutzern können auch die Wörter "remember", "start", "finished" und "forget" ähnliche Fehler auslösen. Selbst wenn man "definition" zum Suchbegriff hinzufügt, kann AI Overview nicht wieder normal funktionieren.

Google hat darauf geantwortet, dass dieses Problem nicht mit der neuen Suchfunktion von I/O zusammenhängt, sondern ein Problem von AI Overviews selbst sei. Das Team arbeite an einer Lösung.

Die Suche ist das Herzstück von Google. Wenn es bei der Suche zu Problemen kommt, wird jeder nur denken: "Google geht unter."

Jetzt liegt der Druck auf Gemini 3.5 Pro.

Was die Außenwelt wirklich sehen möchte, ist nicht, ob Google AI in alle Eingänge integrieren kann. Diese Frage ist bereits beantwortet: Google hat es tatsächlich geschafft. Was die Außenwelt sehen möchte, ist, ob Google ein genügend intelligent, stabiles und überzeugendes Flaggschiffmodell entwickeln kann, um zu beweisen, dass es nicht hinterherhinkt.

Diese Aufgabe kann Flash nicht erfüllen. Es ist ein Ausführungsmodell, das schnell ist und Aufgaben erledigen kann, aber nicht genug Intelligenz hat. Es eignet sich als Subtask-Ausführer in der Agenten-Architektur und kann mit einem starken Planer zusammenarbeiten. Aber es ist kein Flaggschiff und kann Googles Image in der AI-Ära nicht repräsentieren.

Am Ende bleibt nur 3.5 Pro.

Derzeit befindet sich Gemini 3.5 Pro noch in der internen Testphase. In einem offiziellen Blogbeitrag heißt es: "Wir arbeiten auch an der Entwicklung von 3.5 Pro. Es wird bereits intern verwendet, und wir erwarten, es nächsten Monat (Juni) herauszubringen."

Tulsee Doshi, der Google-Produktmanager, hat erklärt: "3.5 Pro ist wie ein Projektmanager, der sich überlegt, wie die Dinge zu tun sind; Flash ist wie ein Ausführungsteam, das die einzelnen Aufgaben ausführt. Wo es wirklich um Schlussfolgerungen und Planung geht, muss man sich an das größere Pro wenden; wo es nur darum geht, Werkzeuge schnell aufzurufen und Aufgaben in Massen zu bearbeiten, reicht Flash aus."

Die Architektur selbst ist in Ordnung, aber das Problem ist, dass Pro noch nicht fertig ist. In vielen Szenarien muss Flash alleine die Last tragen.

Deshalb ist Gemini 3.5 Pro zu einem zweiten Prüfpunkt geworden.

Wenn 3.5 Pro nach der Veröffentlichung gut abschneidet, kann Google das Problem noch retten.

Ich habe bereits die Formulierung parat: "Das Einbinden von Flash in alle Produkte war ein Versuch, der zu einigen schlechten Benutzererfahrungen geführt hat. Aber wir haben jetzt 3.5 Pro veröffentlicht, das definitiv gut funktioniert. Wir laden Sie ein, es auszuprobieren."

Die Probleme von Flash können als Kompromiss verstanden werden. Pro ist die echte Stärke von Google.

Aber wenn 3.5 Pro nicht gut abschneidet, ist Google in Bezug auf AI vollständig gescheitert.

AI Overview hat triviale Fehler, der ChatBot ist langatmig, WorkSpace verbraucht zu viele Tokens und ist deshalb zu teuer, und Antigravity zeigt keine Fortschritte. Alle diese Produkte werden von Gemini beeinträchtigt und werden von Vorteilen zu Belastungen.

Googles gegenwärtige Situation ist sehr heikel. Es hat Geld, Infrastruktur und DeepMind. Aber seit 3.0 Pro fehlt es an einem starken Flaggschiffmodell.

3.5 Pro soll diese Lücke schließen. Wenn 3.5 Pro das nicht schafft, könnte Google tatsächlich auf dem Weg zu Meta sein.

Google wird zur Hardwarefirma

Google ist jedoch nicht total gescheitert. Im Gegenteil, im Bereich Hardware hat es sich erholt.

Die Q1-2026-Bilanz von Google zeigt, dass das Unternehmensertrag 109,9 Milliarden Dollar beträgt, was einem Anstieg von 22 % gegenüber dem Vorjahr entspricht. Der Ertrag von Google Search & Other beträgt 60,4 Milliarden Dollar, was einem Anstieg von 19 % entspricht. Die YouTube-Werbeeinnahmen betragen etwa