Wer würde noch behaupten, dass Google hinterher hinkt? Im Jahr 2025 hat es ein beeindruckendes Comeback hingelegt.
Im vergehenden Jahr 2025 hat Google in der Künstlichen Intelligenzbranche eine beeindruckende Leistung vorgelegt.
Google war einst wegen der Veröffentlichung des Transformers, aber der Verfehlung der ersten Mover-Vorteile, stark von außen in Zweifel gezogen worden und befand sich in einem Medienwirbel wegen des angeblichen Rückstands in der Entwicklung von Large Language Models. Doch in diesem Jahr hat Google mit einer Reihe bahnbrechender Veröffentlichungen ein beeindruckendes Comeback hingelegt. Es hat der Welt gezeigt, dass KI nicht länger einfach ein Chatbot ist, sondern zu einem "Partner" geworden ist, der Code schreiben, Forschung betreiben und sogar komplexe wissenschaftliche Probleme lösen kann.
Schauen wir uns die von Demis Hassabis präsentierte Jahresbilanz an: Gemini 3, Genie 3, Veo 3, Nano Banana... Es ist tatsächlich eine beeindruckende Leistung.
Zur gleichen Zeit hat Google in seinem offiziellen Blog einen Jahresrückblick über die Forschungsfortschritte veröffentlicht, in dem die Forschungserfolge von 2025 detailliert aufgelistet sind. Die Autoren sind Jeff Dean, Demis Hassabis und James Manyika.
Blog-Adresse: https://blog.google/technology/ai/2025-research-breakthroughs/#ai-models
Bevor wir uns die Details ansehen, wollen wir zunächst die wichtigsten "Waffen" von Google in diesem Jahr zusammenfassen.
- Modellseite: Gemini 3 hat sich an der Spitze etabliert. Seine logischen Schlussfolgerungs- und mathematischen Fähigkeiten haben neue Rekorde aufgestellt, und die Flash-Version bietet ein besseres Preis-Leistungs-Verhältnis als die vorherige Pro-Version.
- Hardwareseite: Die siebte Generation TPU Ironwood bietet eine drastisch erhöhte Rechenleistung und setzt sich an Nvidias Position. Bei der Quantenrechnung wurde ein Durchbruch mit dem "Quanten-Echo" erzielt.
- Anwendungseite: KI ist nicht länger nur ein Chatbot. Mit Antigravity wird die Programmierung neu gestaltet, und mit Veo 3 und Genie 3 wird die Videoerstellung und die Weltmodellierung revolutioniert.
- Wissenschaftliche Seite: Das fünfjährige Jubiläum von AlphaFold und der Nobelpreis für Chemie haben die führende Position von AI for Science festigt. Gemini Deep Think hat in der Mathematik-Olympiade (IMO) und dem Programmierungswettbewerb (ICPC) beide Goldmedaille erreicht, was einen qualitativen Sprung in der abstrakten Schlussfolgerungsfähigkeit von KI markiert.
Im Folgenden finden Sie eine detaillierte technische Zusammenfassung auf der Grundlage des offiziellen Blog-Eintrags:
KI-Modelle: Google hat das GPT-5 aus Altmans Träumen trainiert
Im März dieses Jahres hat die Veröffentlichung von Gemini 2.5 die Grundlage für die technologische Entwicklung des gesamten Jahres gelegt. Im November ist dann Gemini 3 offiziell auf den Markt gekommen und gilt als das bisher beste Werk von Google. Google hat in Bezug auf die Modellinferenz, die multimodale Verständnis und die Betriebseffizienz mehrere wesentliche Sprünge gemacht.
Als das leistungsstärkste Modell von Google zeichnet sich Gemini 3 Pro besonders in der logischen Schlussfolgerung aus. Es hat schnell die Spitze der LMArena-Rangliste erreicht und bei der "Humanity’s Last Exam" (ein strenger Test, der die Fähigkeit von KI, wie ein Mensch zu denken, prüft) hervorragende Ergebnisse erzielt. In der Mathematik hat es mit einer Genauigkeit von 23,4% den Rekord auf der MathArena Apex verbessert.
Gemini 3 ist auf vielen wichtigen KI-Referenztests auf dem neuesten Stand.
Verwandter Link: https://blog.google/products/gemini/gemini-3/
Im Dezember folgte dann die Gemini 3 Flash für Entwickler und Unternehmen. Diese Version setzt Googles Strategie fort, dass die nächste Flash-Version besser sein soll als die vorherige Pro-Version.
Die Daten zeigen, dass die Gesamtqualität von Gemini 3 Flash die von Gemini 2.5 Pro, das im März veröffentlicht wurde, übertrifft, während die Kosten deutlich gesenkt und die Latenz signifikant verbessert wurden. Diese Strategie mit hohem Preis-Leistungs-Verhältnis soll es ermöglichen, dass komplexere Schlussfolgerungsaufgaben schneller und mit niedrigeren Barrieren in die Praxis umgesetzt werden können.
Preis- und Referenztabelle von Gemini 3 Flash.
Verwandter Link: https://blog.google/products/gemini/gemini-3-flash/
Außerhalb der proprietären Gemini-Serie hat Google auch in der Open-Source-Branche viele Aktivitäten unternommen. Die Gemma-Familie hat in diesem Jahr die Transformation von reinen Textmodellen zu multimodalen Modellen vollzogen.
Durch die Erhöhung des Kontextfensters, die Erweiterung der Mehrsprachigkeit und die Optimierung der Effizienz auf einer einzelnen GPU/TPU ist Gemma 3 zu einem der bevorzugten Tools für Entwickler geworden, wenn sie hochleistungsfähige KI lokal einsetzen möchten. Insbesondere die im August veröffentlichte Gemma 3 270M bietet mit ihrer kleinen Parameteranzahl eine extrem hohe Effizienz und markiert Googles technologische Präsenz im Bereich der Edge-KI.
Verwandter Link: https://developers.googleblog.com/en/introducing-gemma-3-270m/
Produkt-Neugestaltung: KI ist nicht länger ein Werkzeug, sondern Ihr "Partner"
Das Jahr 2025 war ein Jahr, in dem KI vom "einseitigen Werkzeug" zum "zentralen Effizienz-Motor" wurde. Google hat durch die Integration von starken Agentic-Fähigkeiten in alle Produkte die KI von einer unterstützenden Rolle zu einer praktischen Infrastruktur transformiert und die Form der Mensch-Maschine-Kooperation neu definiert.
Im Bereich der Softwareentwicklung beschränkt sich Google nicht mehr auf die Bereitstellung von Hilfsmitteln für die Programmierung, sondern arbeitet an der Entwicklung eines intelligenten Agentensystems, das eng mit Entwicklern zusammenarbeiten kann. Das im November veröffentlichte Gemini 3 hat beeindruckende Fähigkeiten in der Codeerstellung und der logischen Verständnis gezeigt. Das gleichzeitig veröffentlichte Google Antigravity markiert ein neues Zeitalter in der KI-gestützten Softwareentwicklung – es hebt den Entwicklungsprozess von der traditionellen "Werkzeugunterstützung" zur "Intelligent-Agenten-Kooperation" und entfaltet die Kreativität und Produktivität der Entwickler.
Verwandter Link: https://antigravity.google/blog/introducing-google-antigravity
Diese Evolution zeigt sich auch in Googles Kernproduktpalette, die von der Hardware bis zur Informationssuche reicht:
Im März hat Search einen wichtigen Wandel erfahren. Durch die Erweiterung der AI-Übersichten und die Einführung eines neuen AI-Modus wurde die Art und Weise, wie Benutzer Informationen erhalten und verarbeiten, neu gestaltet.
Im August ist das hoch erwartete Pixel 10 auf den Markt gekommen. Dank der tiefgreifenden Integration einer Reihe von KI-nativen Funktionen wird es als das intelligenteste und nützlichste Mobiltelefon von Google bisher bewertet.
Im Bereich der Produktivität und des Wissensmanagements haben die Updates am Jahresende die Benutzererfahrung auf ein neues Niveau gehoben. Mit der Einbindung von Gemini 3 im November hat die Gemini App sowohl in der Intelligenz als auch in der Fähigkeit einen Sprung gemacht. Gleichzeitig hat NotebookLM im gleichen Monat die Funktion Deep Research hinzugefügt und die Unterstützung für mehr Datentypen ermöglicht, wodurch es von einem einfachen Notizwerkzeug zu einem professionellen intelligenten Forschungsassistenten für die Verarbeitung komplexer Informationsströme geworden ist.
Verwandter Link: https://blog.google/technology/google-labs/notebooklm-deep-research-file-types/
Kreative Generierung: Das Ende der "Stummfilmzeit", Hollywood wird sich Sorgen machen
Das Jahr 2025 war ein Jahr der Veränderung in der generativen Medienbranche. Google hat durch die Veröffentlichung einer Reihe bahnbrechender Modelle und Tools, die Video, Bild, Audio und die virtuelle Weltmodellierung umfassen, den Künstlern bisher unbekannte Möglichkeiten eröffnet.
Im Bereich der Videoerstellung hat das im Mai veröffentlichte Veo 3 erstmals die native Audiogenerierung ermöglicht. In Kombination mit der gleichzeitig aktualisierten Music AI Sandbox können nun Schritte, Windgeräusche und Hintergrundmusik perfekt mit den Bildern synchronisiert werden, was das Ende der "Stummfilmzeit" von KI-Videos markiert.
Das Update im Oktober hat die Branchenstandards noch einmal erhöht. Die Version Veo 3.1 hat nicht nur die physikalische Konsistenz bei Licht- und Schatteneffekten sowie Objektkollisionen stark verbessert, sondern auch eng mit dem neuen kreativen Tool Flow integriert. Vor allem die Funktion "Start- und Endbildsteuerung" wurde verstärkt, die es Künstlern ermöglicht, den Beginn und das Ende eines Videos präzise zu bestimmen, während die KI den dazwischen liegenden Prozess ergänzt. Dies erhöht die Kontrollierbarkeit der Erzählung erheblich.
Verwandter Link: https://developers.googleblog.com/introducing-veo-3-1-and-new-creative-capabilities-in-the-gemini-api/
Im Bereich der Bildgenerierung hat Nano Banana in diesem Jahr nach der Gründung von Imagen 4 im Mai stark aufgefallen und schon bei anonymen Tests aufgrund seiner hervorragenden Leistung Beachtung gesucht. Im August, als eine bedeutende Weiterentwicklung der Bildgenerierung, ist Nano Banana für seine hohe Befolgungsfähigkeit von Anweisungen bekannt. Es hat das Problem des Verlusts von Details bei der "Text-zu-Bild-Generierung" gelöst.
Die im November veröffentlichte Nano Banana Pro hat die Benutzererfahrung auf ein neues Niveau gehoben. Als die Flaggschiffversion der Serie hat sie erstmals den "Deep Thinking"-Modus eingeführt, der vor dem Zeichnen logische Schlussfolgerungen zieht. Dadurch kann es nicht nur äußerst komplexe Prompt-Kompositionen präzise wiedergeben, sondern auch eine hochwertige Textrendering-Fähigkeit bieten, die sowohl bei der Plakatgestaltung als auch bei der Diagrammerstellung auf professionellem Niveau liegt.
Das Wort "Berlin" ist in die Architektur der Stadtstraßen integriert und erstreckt sich über mehrere Gebäude.
Verwandter Link: https://blog.google/technology/ai/nano-banana-pro/
Darüber hinaus hat Google Labs in diesem Jahr zahlreiche bahnbrechende Experimente durchgeführt: Vom Stitch, das Entwürfe sofort in Code umwandelt, über Jules, dem asynchronen Kooperationspartner für Entwickler, bis hin zum 3D-Video-Kommunikationsplattform Google Beam – KI entwickelt sich von einem einfachen Medien-Generierungstool zu einem produktiven Kern, der den Arbeitsablauf neu gestaltet.