StartseiteArtikel

Google I/O - Eine umfassende Zusammenfassung: Zwei neue Modelle starten, Audio-Brillen treten auf, und Gemini übernimmt alles

雷科技2026-05-20 07:49
Nächstes Jahr könnte man es einfach Gemini I/O nennen.

Nach langem Warten hat die Google I/O 2026 endlich um Mitternacht am 20. Mai 2026 (Pekingzeit) begonnen. Da Google die neuen Funktionen von Android 17 im Voraus mit The Android Show "abgeleitet" hat, ist künstliche Intelligenz (KI) endlich zur Hauptattraktion der Google I/O 2026 geworden.

Im Gegensatz zu anderen KI - Unternehmen kontrolliert Google mehrere verschiedene Internet - Ökosysteme wie Gemini, YouTube, die Google - Websuche und Android. Daher ist die Frage, "wie KI diese Ökosysteme 'verstärken' kann", auch ein Schwerpunkt dieser Google I/O.

Gemini Omni, Gemini 3.5: Neue Modelle machen Google KI noch vielseitiger

Bei den Gemini - Modellen hat Google auf der Google I/O das neueste und vielseitigste Gemini Omni offiziell vorgestellt. Wie vielseitig ist es? Mit einem Satz zusammengefasst: "Gemini Omni kann aus jeder Art von Eingabe jede Art von Ausgabe generieren", und es kann auch direkt während des Generierungsprozesses in Form eines Dialogs modifiziert werden.

Bildquelle: Google

Nehmen wir die MV - Generierung als Beispiel. Wenn man nur Musik, Video - und Bildmaterial sowie grobe Anforderungen an das Bild an Gemini Omni "gibt", kann es direkt das entsprechende Kurzvideo ausgeben. Auf der Veranstaltung hat Google auch ein sehr beeindruckendes AIGC - Beispiel demonstriert:

Zeichnet man auf einem Blatt Papier einen Kreis und fügt eine Textbeschreibung hinzu, kann Gemini Omni direkt ein komplettes Effektvideo ausgeben. Aber das ist noch nicht alles. Wenn man mit den Bildelementen oder dem Stil nicht zufrieden ist, kann man mit einem Satz die angegebenen Elemente präzise ändern, ohne die anderen Bildelemente zu verändern, zum Beispiel "ersetze das Glasgebäude durch Seifenblasen", wobei letztere sogar eigene physikalische Kollisionseffekte haben.

Bildquelle: Google

In den Worten von Google selbst: "Gemini Omni ist wie die Nano Banana im Videobereich."

Laut der Ankündigung von Google wird das Google Omni Flash - Modell ab sofort auf Plattformen wie der Gemini App, Google Flow und YouTube Shorts verfügbar sein, und die entsprechende API wird später freigegeben.

Bildquelle: Google

Außer dem "vielseitigen Modell" Google Omni wurde Gemini auf der Google I/O auch auf die Version Gemini 3.5 (Gemini 3.5 Flash) aktualisiert. Im Vergleich zu Gemini 3.1 Pro hat Gemini 3.5 Flash in Tests wie Programmierung, Real - World Agentic und Massen - Tool - Aufruf Verbesserungen erzielt.

Natürlich gilt für KI - Modelle: "Wo es leichte Flash - Versionen gibt, gibt es auch professionelle Pro - Versionen". Auf der Veranstaltung hat Google auch angekündigt, dass die Gemini 3.5 Pro im nächsten Monat erscheinen wird, aber keine weiteren Informationen veröffentlicht.

Zusammengefasst: Google hat diesmal alles erreicht, was man mit "schnell, viel, gut und billig" beschreiben kann.

Google Antigravity, Gemini Spark: Schnellere und stärkere Agenten

Da die Fähigkeiten des zugrunde liegenden Modells gestärkt wurden, hat sich auch der auf Gemini basierende KI - Agent aktualisiert.

Bildquelle: Google

Für Entwickler hat Google die KI - Entwicklungsumgebung Antigravity auch mit Gemini 3.5 Flash ausgestattet. Laut Google hat Antigravity mit der Unterstützung von Gemini 3.5 Flash in nur 12 Stunden einen Betriebssystemkern erstellt, und die Kosten für die KI - API während des gesamten Entwicklungsprozesses beliefen sich auf weniger als 1.000 US - Dollar.

Bildquelle: Google

Google hat sogar die Interaktionsoberfläche der Google - Suche mit Antigravity und Gemini 3.5 Flash neu gestaltet und das neue Konzept der "generativen Benutzeroberfläche" eingeführt. Freunde, die Google oder andere KI - Suchmaschinen häufig benutzen, wissen, dass selbst wenn man die KI - Mode auf der Suchseite aktiviert (hier nicht die Wissensdatenbank - Suche in der KI - App über "Fragen"), die KI - Mode immer noch in Form eines Chat - Fensters (ChatBox) die Ergebnisse ausgibt.

Bildquelle: Google

Für die normale KI - Suche reicht das Chat - Fenster - Interaktionsmodell in der Regel aus. Aber wenn ein Benutzer eine Frage stellt, die eine anschauliche Demonstration erfordert, wie z. B. "Wie funktioniert ein Tourbillon?", ist das Textfeld - Modell nicht hilfreich. Deshalb hat Google auf der Grundlage der Programmierfähigkeiten von Antigravity eine "adaptiv und selbstgenerierende" KI - Suchoberfläche entwickelt.

Bildquelle: Google

Einfach ausgedrückt: Bei komplexen Fragen schreibt Google Search mit "Vibe Coding" direkt eine interaktive Frontend - Webseite, um die Fragen des Benutzers direkt in interaktiver Weise zu beantworten.

Leider wird diese Funktion erst im Sommer 2026 für die Benutzer freigegeben. Die gute Nachricht ist, dass diese Funktion ein Update der Google - Suche ist und man nicht für die Gemini - Subscription bezahlen muss, um sie zu nutzen. Außerdem wurde die Benutzeroberfläche der Gemini App aktualisiert und ist nun besser mit den neuen Android - visuellen Elementen vereinbar.

Dank der multimodalen Fähigkeiten von Gemini 3.5 Flash haben sich auch die KI - Vorhersage und die multimodalen Fähigkeiten der Google - Suche verbessert. Neben Text und Bild - Suche kann die neue Google - Suche auch direkt Videos oder Dokumente eingeben. Die früher nach Big - Data - Intelligenz sortierten Suchempfehlungen sind jetzt zu einer KI - Sucherweiterung auf der Grundlage von Gemini 3.5 Flash geworden.

Bildquelle: Google

Außer den sichtbaren Updates an der Vorderseite hat Google auch die "Hintergrund - Fähigkeiten" des Such - Agents vollständig verbessert: Der neue Such - Agent kann im Hintergrund rund um die Uhr laufen und bestimmte Informationen nach den Anforderungen des Benutzers kontinuierlich überwachen. Beispielsweise kann Lei (Name) vor dem Schlafen gehen den Such - Agent anweisen, die KI - Nachrichten von Unternehmen wie OpenAI, Anthropic, Grok, Perplexity und auf X ständig zu verfolgen. Wenn es brennende Neuigkeiten gibt, kann er direkt meine Mobiltelefonnummer per E - Mail bombardieren, damit ich aufstehe und schreibe.

Was die Agenten angeht, hat Google auf der Veranstaltung auch einen neuen Agent für Privatnutzer, den Gemini Spark, offiziell vorgestellt. Wie andere KI - Agenten kann auch der Gemini Spark rund um die Uhr das Mobiltelefon und den Browser des Benutzers übernehmen. Im Gegensatz zu den derzeitigen Mainstream - verwalteten Agenten läuft der Gemini Spark in einer speziellen virtuellen Umgebung.

Bildquelle: Google

Offensichtlich wird der Gemini Spark ebenfalls von Gemini 3.5 Flash und Antigravity angetrieben und unterstützt natürlich auch die Sprachinteraktion und die Hintergrundantwort. Bei der externen Kopplung kann der Gemini Spark nicht nur direkt mit anderen Komponenten des Google - Ökosystems (Google Docs, Google Calendar, Gmail usw.) gekoppelt werden, sondern auch über das MCP - Protokoll mit externen Apps kommunizieren, um eine umfassendere Aufgabe - verwaltung zu erreichen.

Google hat auf der Veranstaltung die Plattform - Kompatibilität des Gemini Spark nicht bekannt gegeben. Lei Technology geht davon aus, dass der Gemini Spark als Gemini App (iOS) und Google - Suchkomponente (Android) auf Mobiltelefonen verfügbar sein wird.

Bildquelle: Google

Während der Laufzeit des KI - Agents (egal ob im Vordergrund oder Hintergrund) wird die neue Android Halo - Funktion ein Agent - Status - Symbol in der linken oberen Ecke des Android - Mobiltelefonbildschirms anzeigen, damit der Benutzer jederzeit zur Agent - Oberfläche springen kann. Das fühlt sich ähnlich an wie die "Kamera - Hinweis" und "Mikrofon - Hinweis" auf heutigen Mobiltelefonen.

Nach Ansicht von Lei Technology betont das Auftauchen von Android Halo auch aus einer anderen Perspektive die Wichtigkeit des Agents: Obwohl der Gemini Spark technisch gesehen nur eine "Softwarefunktion" ist, hat er inzwischen die gleiche Stellung wie Kamera und Mikrofon und ist ein unverzichtbarer Kernbestandteil des Mobiltelefons.

Bildquelle: Google

Beim Computer hat Google erwähnt, dass der Gemini Spark im Sommer 2026 im Chrome - Browser verfügbar sein wird.

Im Gegensatz zu einigen bezahlten chinesischen KI - Agenten wie Doubao ist der Gemini Spark ein vollständiges Abonnement - Feature und wird nächste Woche für Google AI Ultra - Abonnenten freigegeben.

Es ist erwähnenswert, dass Google zwischen der ursprünglichen AI Pro (20 US - Dollar pro Monat) und AI Ultra (250 US - Dollar pro Monat, zeitweise auf 200 US - Dollar pro Monat reduziert) eine "Jugendversion" des AI Ultra - Levels (100 US - Dollar pro Monat) hinzugefügt hat, um Unternehmensnutzer und Privatnutzer mit hohem Verbrauch zu unterscheiden.

Bildquelle: Google