StartseiteArtikel

Google kündigt plötzlich die kostenlose Version von Gemini, was die Gemüter erregt. Wird die Datennutzung zum Trainieren des Modells hintergangen? GPT-5.2 greift Gemini 3 überraschend an. Demis Hassabis: Google muss die stärkste Position einnehmen.

AI前线2025-12-08 17:22
Google hat gerade die tägliche Anzahl der Anfragen für die kostenlose Version der Gemini API von 250 auf 20 reduziert. Jetzt funktionieren meine Automatisierungsscripte in n8n praktisch nicht mehr.

„Google hat die tägliche Anforderungsanzahl für die kostenlose Version der Gemini-API von 250 auf 20 gesenkt. Meine automatisierten n8n-Skripte funktionieren mittlerweile praktisch nicht mehr. Das ist für jeden, der kleine Projekte entwickelt, ein Schlag.“ So äußerte sich der Internetnutzer Nilvarcus.

Neulich haben Internetnutzer gemeldet, dass Google die Beschränkungen für die kostenlose Ebene der Gemini-API verschärft hat: Die Pro-Serie wurde abgeschafft, und die Flash-Serie erlaubt nur noch 20 Anfragen pro Tag. Das reicht für Entwickler bei weitem nicht aus.

Einige Internetnutzer haben außerdem festgestellt, dass Google den Eintrag für die kostenlose Gemini-API aus seiner Liste der „Batch-API-Geschwindigkeitsbeschränkungen“ entfernt hat. „Es ist endgültig vorbei.“

Im heftigen Wettbewerb um die besten großen Modelle hat Google auch in der Vergangenheit kostenlose und preiswerte Angebote genutzt, um Nutzer anzuziehen. Beispielsweise hat Google im Januar dieses Jahres ein kostenloses Paket für die Gemini-API namens Gemini 1.5 Flash eingeführt, das Entwicklern täglich bis zu 1,5 Milliarden kostenlose Token zur Verfügung stellte. Dieses kostenlose Paket umfasste 15 Anfragen pro Minute, 1 Million Token pro Minute sowie 1.500 Anfragen pro Tag. Darüber hinaus konnten Entwickler eine kostenlose Kontext-Caching-Service nutzen, die bis zu 1 Million Token pro Stunde speichern konnte. Die Feinabstimmungsfunktion war ebenfalls vollständig kostenlos.

Abgesehen von der drastischen Reduzierung ärgert es einige Entwickler, dass diese Politik ohne vorherige Ankündigung eingeführt wurde.

„Ich habe immer gedacht, dass es keine kostenlosen Mahlzeiten gibt. Aber die Vorgehensweise von Google diesmal ist wirklich nicht gut. Selbst wenn mein System und meine Anwendungen nur experimenteller Natur sind, ist es sehr schmerzhaft, wenn alles plötzlich und ohne Vorwarnung einfriert. Hätten sie nicht einfach beim Release von Gemini 3 sagen können: ‚Übrigens werden wir die kostenlosen API-Aufrufe für Entwickler in zwei Wochen einstellen‘? Eine verantwortungsbewusste und vertrauenswürdige Firma hätte das tun sollen.“ So äußerte sich ein Entwickler.

„Ja, Google hat jetzt genug Daten gesammelt und liegt seinen Konkurrenten voraus. Deshalb ändert es seine Strategie und setzt stark auf Profitmaximierung. Wir alle wussten, dass das kostenlose Paket von Anfang an zu großzügig war, aber wir haben mit unseren eigenen Daten bezahlt und dabei geholfen, das Modell zu trainieren.“ Ein Entwickler sagte: „Der gute Seele des KI-Bereichs hat seine Öffentlichkeit gesammelt und will jetzt zur Bezahlung übergehen.“

Dieser Woche möglicherweise erneut gegen OpenAI

In der letzten Zeit hat Google mit Gemini 3 eine große Anzahl von Nutzern gewonnen. Laut Daten der Financial Times erreichte die durchschnittliche Verweildauer der Nutzer bei einzelnen Benutzungen von Gemini auf Desktop- und Mobilgeräten Ende 2025 etwa 7,2 Minuten, erstmals übertroffen ChatGPT mit etwa 6 Minuten und lag auch etwas höher als Anthropic Claude mit etwa 6 Minuten.

Aber der heftige Wettlauf um die besten großen Modelle geht weiter. Berichten zufolge plant OpenAI, mit dem kommenden GPT-5.2 erstmals auf Google Gemini 3 zu reagieren. Das ursprünglich für Ende Dezember geplante GPT-5.2 soll auf den 9. Dezember vorgezogen werden. Die Testergebnisse von GPT-5.2 sind bereits im Internet bekannt geworden. Wenn diese Daten bestätigt werden, würde der Wettbewerbsvorteil wieder bei OpenAI liegen.

Gerade als die Veröffentlichung von GPT-5.2 im Netz rumorschte, stellten Internetnutzer fest, dass Gemini 3 Flash jetzt in der LM Arena verfügbar ist. Einige sagten: „Gemini 3 Flash scheint das Gegenstück von Google zu GPT 5.2 zu sein.“

Das hat die Internetnutzer sehr aufgeregt: „Es wird spannend. OpenAI und Google haben ihre Positionen getauscht. Nano Banana pro und Gemini 3 Flash sind die Hinterhand von Google, um GPT-5.2, das OpenAI diese Woche veröffentlichen wird, abzuwehren.“

„Einige Teile der KI-Branche mögen tatsächlich überbewertet sein, wie die absurden hohen Seed-Finanzierungen. Aber ich glaube mehr als jeder andere, dass KI die umwerfendste Technologie ist, und dass diese Investitionen auf lange Sicht lohnen werden. Meine Aufgabe ist es, dass DeepMind und Google unabhängig davon, ob der Bubble platzt oder nicht, in der stärksten Position bleiben.“ So sagte Demis Hassabis, Mitbegründer und CEO von Google DeepMind, bei einem Axios-Event, was seine Entschlossenheit zeigt, gegen OpenAI bis zum Ende zu konkurrieren.

Google zufrieden mit der Leistung von Gemini 3

In diesem Wettbewerb hat Google, das zunächst schlechte Ergebnisse erzielte, mit Gemini 3 einen Sieg errungen.

„Wir sind sehr zufrieden mit der Perspektive, dem Stil und den Fähigkeiten von Gemini 3. Ich mag es, dass es kurz und bündig antwortet und auch manchmal widerspricht, anstatt immer zuzustimmen. Wenn deine Meinung nicht sehr vernünftig ist, wird es sie sanft zurückweisen. Ich denke, dass man spürt, dass es sich um einen Sprung in der Intelligenz handelt, und dass es dadurch nützlicher wird.“ So sagte Hassabis.

Das lässt an die Zeit denken, als OpenAI GPT-4o zurückgesetzt hat, weil ChatGPT zu anpassungsfähig war. Man sieht, dass Google diesen Fehler bewusst vermieden hat.

Hassabis freut sich sehr, wenn Nutzer Gemini 3 auf verschiedene Weise ausprobieren. Sobald du eine neue Technologie veröffentlichst, werden Millionen oder sogar Milliarden von Nutzern sie sofort nutzen. Wir werden ständig von den coolen Anwendungen überrascht, die die Nutzer schnell entwickeln. Das ist der Grund, warum wir diese Zeit lieben, in der Forschung und Produktentwicklung so eng miteinander verbunden sind.“

Seine persönliche Lieblingsfunktion von Gemini 3 ist die Möglichkeit, ein Spiel „in einem Zug“ zu entwickeln.

„Als ich anfing, AI für Spiele zu entwickeln, dachte ich, dass wir jetzt sehr nahe daran sind, in wenigen Stunden kommerzielle Spiele mit einem Modell zu erstellen, was früher Jahre gedauert hätte. Das zeigt die unglaubliche Tiefe und Fähigkeit des Modells: Es kann sehr hochrangige Anweisungen verstehen und sehr detaillierte Ergebnisse generieren. Ein weiteres besonders starkes Merkmal von Gemini 3 ist die Frontend- und Webentwicklung. Es ist sowohl ästhetisch, kreativ als auch technisch hervorragend.“

„Wie bei allen Modellen ist die Innovationsgeschwindigkeit so hoch, dass wir so viel Zeit damit verbringen, neue Versionen zu entwickeln, dass wir nicht einmal ein Zehntel der Fähigkeiten der vorhandenen Modelle erkunden können.“ Hassabis sagte: „Jedes Mal, wenn wir eine neue Version veröffentlichen, habe ich das Gefühl, dass ich nicht einmal ein Zehntel der Fähigkeiten des vorhandenen Systems erkunden konnte, bevor ich mich sofort der Entwicklung der nächsten Generation widmen muss, und dabei auch sicherzustellen, dass es sicher und zuverlässig ist. Deshalb nutzen die Nutzer die Modelle sogar intensiver als wir intern.“

Die Skalierungsregel bis an die Grenzen treiben

Einige Internetnutzer sind skeptisch gegenüber der plötzlichen Beschränkung der kostenlosen Gemini-API: „Haben sie möglicherweise nicht genug Rechenleistung? Ich habe in den letzten Tagen in AI Studio mit Nano Banana Pro gespielt, und seit vorgestern ist es sehr langsam. Es dauert ewig, bis ein Bild geladen wird.“ Ein anderer vermutet: „Mit der Veröffentlichung des neuen Modells ist das alte Modell nicht abgeschaltet worden, und die Kapazität ist überlastet.“

Obwohl der wahre Grund unbekannt ist, stimmt Hassabis zu, dass Google immer mehr Rechenleistung benötigt: „Wir haben in Google und DeepMind tatsächlich viele Ressourcen, aber nicht unendlich viele. Wir brauchen immer mehr Rechenleistung, egal wie viel wir bereits haben. Wir können so umfangreiche Forschungen betreiben, nur weil wir diese Ressourcen haben.“

Er befürwortet weiterhin die Skalierungsregel. Als er gefragt wurde, ob AGI nur durch Verbesserungen an großen Modellen und generativen KI-Systemen erreicht werden kann, sagte Hassabis: „Wir müssen die aktuelle Systemgröße bis an die Grenzen treiben. Es wird zumindest ein wichtiger Bestandteil von AGI sein. Es ist auch möglich, dass die Skalierung allein ausreicht, aber ich denke, dass wir später feststellen werden, dass wir noch ein oder zwei Durchbrüche wie den Transformer oder AlphaZero benötigen.“

Hassabis glaubt, dass es etwa fünf bis zehn Jahre dauern wird, bis AGI erreicht wird, aber er hat hohe Ansprüche an AGI: Es muss alle menschlichen kognitiven Fähigkeiten haben, einschließlich der Fähigkeit zu schöpferischer Arbeit und Erfindungen.

Er erklärt, dass aktuelle LLMs in einigen Bereichen wie Doktoren oder Wettbewerbssiege erscheinen, aber in anderen Bereichen wie Konsistenz, kontinuierlichem Lernen, Langzeitplanung und komplexer Argumentation noch sehr schwach sind. Sie haben eine zackige Intelligenz. Sie werden diese Fähigkeiten schließlich entwickeln, aber es werden wahrscheinlich noch ein oder zwei bedeutende Durchbrüche erforderlich sein.

Hassabis erinnert sich, dass Google 2017 und 2018 viele Projekte hatte: Ein eigenes Sprachmodell namens Chinchilla, ein internes Modell namens Sparrow, und das Team war auch der erste, der einige Skalierungsregeln entdeckte, die Chinchilla-Skalierungsregeln. Es gab auch andere Projekte, wie AlphaZero, das auf AlphaGo basiert, ein reines Reinforcement-Learning-System, und Architekturen, die von der Kognitionswissenschaft und Neurowissenschaft inspiriert waren. „Damals waren wir uns nicht sicher, welcher Weg am schnellsten und sichersten zu AGI führen würde. Meine Aufgabe war es, AGI zu entwickeln.“

„Ich bin tatsächlich sehr pragmatisch in Bezug auf den Weg: Es muss funktionieren. Wenn wir sehen, dass die Skalierung tatsächlich funktioniert, setzen wir immer mehr Ressourcen in diese Entwicklungsrichtung ein.“ Hassabis sagte: „Das ist das Schöne an der wissenschaftlichen Methode. Wenn du ein echter Wissenschaftler bist, kannst du nicht dogmatisch an einer Idee festhalten, sondern musst der empirischen Evidenz folgen.“

Der Vorteil als Wissenschaftler

Als Wissenschaftler behandelt Hassabis alle Probleme standardmäßig mit der wissenschaftlichen Methode. Er glaubt, dass die wissenschaftliche Methode eine der wichtigsten Ideen in der Geschichte der Menschheit ist, weil sie die Aufklärung, die moderne Wissenschaft und die moderne Zivilisation hervorgebracht hat. Der experimentelle Geist, die Aktualisierung von Hypothesen und die Evidenz-basierte Entscheidungsfindung der wissenschaftlichen Methode sind eine äußerst mächtige Denkweise, und sie gilt nicht nur für die Wissenschaft, sondern auch für den Alltag und das Geschäft.

„Wir befinden uns in dem wahrscheinlich heftigsten Wettbewerb in der Geschichte der Technologie, aber wir unterscheiden uns durch unsere Präzision und Genauigkeit. Die wissenschaftliche Methode ist der Kern unserer Arbeit. Wir kombinieren Spitzenforschung, Spitzen-Engineering und Spitzen-Infrastruktur, und in der Spitzengruppe der KI muss man alle drei haben. Ich denke, dass es nicht viele Institutionen gibt, die in all diesen Bereichen Weltklasse-Fähigkeiten haben, und wir sind eine von ihnen.“ Hassabis sagte: „Ich nutze sie immer bis an die Grenzen, und ich denke, dass das auch unser Vorteil als Forschungsinstitut und Engineering-Team ist.“

Beim Wettbewerb um KI-Talente sagte Hassabis offen: „Die Situation ist in letzter Zeit wirklich verrückt geworden, wie beispielsweise die Vorgehensweise von Meta.“ Aber er sagte, dass Google Menschen sucht, die von einer Mission angetrieben sind. „DeepMind hat die beste Mission und Full-Stack-Fähigkeiten. Wenn du an der Spitze arbeiten willst, ist dies der beste Ort. Die besten Wissenschaftler und Ingenieure wollen an den Spitzen-Systemen beteiligt sein, und das wiederum zieht mehr Spitzen-Talente an.“

Drei Hauptrichtungen für die Zukunft von Google

Als einer der Weltführer in der Entwicklung von großen KI-Modellen ist die Strategie von Google für die Branche sehr interessant.

Laut Hassabis setzt Google derzeit auf drei Hauptrichtungen.

Die erste ist die Modalitätsfusion. Gemini ist von Anfang an ein multimodales Modell, das Bilder, Videos, Text und Audio verarbeiten kann und auch immer besser in der Lage ist, Inhalte in diesen Modalitäten zu generieren. Google beobachtet positive Effekte der Interaktion zwischen verschiedenen Modalitäten. Ein Beispiel ist das neueste Bildmodell Nano Banana Pro, das eine erstaunliche Fähigkeit zur visuellen Wahrnehmung zeigt und sehr genaue Infografiken generieren kann. Hassabis glaubt, dass wir in den nächsten Jahren sehr interessante Kombinationen von Video- und Sprachmodellen sehen werden.

Unter den Technologien, die Google entwickelt und bereits einsetzt, findet Hassabis die multimodale Verarbeitungsfähigkeit der Modelle, insbesondere die Verarbeitung von Video, Bildern und Audio, erstaunlich und unterschätzt. Er betont besonders die Videoverarbeitung.

„Wenn du Gemini eine YouTube-Video verarbeiten lässt, kannst du ihm verschiedene Fragen stellen. Ich bin immer wieder überrascht, wie gut es das Video versteht. Obwohl es nicht immer perfekt ist, ist seine Leistung in den meisten Fällen beeindruckend.“

Hassabis nimmt das Beispiel seines Lieblingsfilms „Fight Club“, in dem eine Person vor einem Kampf seinen Ring abnimmt. Er hat Gemini gefragt, was diese Handlung bedeutet, und es hat eine sehr interessante philosophische Interpretation gegeben: Diese Handlung symbolisiert die Abkehr vom Alltag und die Hingabe an die Welt des Kampfes. „Diese Tiefe des Metakognition ist eine der starken Fähigkeiten dieser Systeme.“

Außerdem hat Google eine Funktion namens Gemini Live, mit der du dein Smartphone auf ein Objekt richten kannst, beispielsweise indem du deinem Smartphone sagst: „Du bist ein Mechaniker“, und es kann dir bei der Bearbeitung der Aufgabe helfen. Idealerweise sollte diese Funktion in Brillen oder anderen Geräten implementiert werden, so dass du deine Hände frei haben kannst. Aber Hassabis glaubt,