WWDC 2026: Das teuerste Eingeständnis der Niederlage in der Geschichte des Silicon Valleys – Siri mit 1,2 Billionen Parametern basiert auf Gemini, aber es läuft nicht auf deinem Handy
Dies könnte Tim Cooks letzte Chance sein, bei einer Apple-Presskonferenz das vertraute "Good morning" zu sagen.
Um Mitternacht am 9. Juni (Beijing-Zeit) hielt Apple eine Keynotespeech für die WWDC 2026. Laut früheren Meldungen wird Tim Cook am 1. September von seinem Amt als Apple-CEO zurücktreten. Daher wird allgemein angenommen, dass diese WWDC die letzte große Apple-Pressveranstaltung ist, die er als CEO leitet. Vor Beginn der Veranstaltung veröffentlichte Cook auch im Voraus ein besonderes Video auf X und hat auf eine lockere und humorvolle Weise eine Abschiedsvorwegnahme für seine klassische Einleitung gemacht.
Seit Jahren beginnt Tim Cook fast immer mit dem gleichen "Good morning" eine Apple-Presskonferenz. Dieser einfache Gruß ist bereits zu einem festen Ritual der Apple-Keynotes geworden und wurde von den Nutzern auch zu verschiedenen Memes gemacht. In diesem Video lud Cook mehrere Film- und Fernsehstars ein, um das "Good morning" auf verschiedene Arten zu interpretieren. Dies scheint sowohl wie eine Selbstironie als auch wie eine Vorwegnahme für diese besondere WWDC zu sein.
https://x.com/tim_cook/status/2063973568787226897
Im April dieses Jahres kündigte Cook an, dass er im September die Leitung von Apple an John Ternus übergeben wird. Cook hat dazu beigetragen, dass Apple zu einem der wertvollsten Unternehmen der Welt wurde. Ternus ist ein ausgebildeter Maschineningenieur und ist derzeit für die Entwicklung von Apple-Hardwareprodukten wie Mac-Computer und iPhone verantwortlich.
Obwohl die Öffentlichkeit der Meinung ist, dass Apple in Bezug auf KI in der Vergangenheit Fehler gemacht hat, hat das Unternehmen unter Cooks Führung dennoch großen Erfolg erzielt. Mindestens in den 15 Jahren, in denen er als CEO arbeitete, stieg der Apple-Aktienkurs nach der Aktiensplit-Anpassung um etwa 2000%.
Aber abgesehen von diesem etwas abschiedsähnlichen Anfang ist der eigentliche Höhepunkt der WWDC 2026, wie Apple seine KI-Geschichte in Zukunft erzählen wird.
Siri von Grund auf neu
Bei dieser WWDC könnte der am meisten beobachtete Star nicht nur iOS, macOS oder neue Entwicklertools sein, sondern Siri. Im vergangenen Jahr war Apple Intelligence großes Erwartungen entgegengekommen, aber die wichtigste Siri-Upgrade wurde immer wieder hinausgeschoben. Schließlich wurde Apple bewusst, dass es sich nicht nur um eine Verzögerung der Funktionen handelt, sondern um eine KI-Strategiekrise.
Laut Mark Gurman hatte Apple Anfang 2025 eine wichtige interne Sitzung abgehalten, um zu diskutieren, wie man mit der schlechten Leistung von Apple Intelligence und der Verzögerung der Siri-Umgestaltung umgehen kann. Schließlich wurde die Neugestaltung von Siri in einem neuen Organisationsplan aufgenommen. Mit anderen Worten, die neue Siri, die auf dieser WWDC erscheinen könnte, ist nicht eine normale Produktiteration, sondern das Ergebnis einer zwangsweisen Beschleunigung der Anpassung von Apple in der Welle der generativen KI.
Wenn man sagt, dass die alte Siri eher wie ein Sprachbefehlseingang war, dann versucht Apple diesmal, ein neu definiertes systemweites KI-Assistenten zu präsentieren.
Laut Apple ist die neue Siri AI nicht einfach ein paar generative KI-Funktionen auf die alte Siri aufgesetzt, sondern eine Neugestaltung von der untersten Architektur bis zur Interaktionsweise.
"Siri wurde grundlegend neu gestaltet und basiert auf einer starken KI. Sie nutzt die neue Architektur von Apple Intelligence voll aus, einschließlich des nächsten Generation Apple Foundation-Modells, das auf Geräten und Servern laufen kann (unter Verwendung privater Cloud-Computing-Ressourcen)."
Derzeit verfügt Apple Intelligence bereits über das zweite Generation-Endgeräten-Modell. In der neuen Erfahrung wurde die Diktierfunktion verbessert, und die Fähigkeit, den persönlichen Kontext zu verstehen, wurde in das neue System integriert. Apple Intelligence nutzt die semantische Indizierung von Spotlight, um die Suche zu verbessern und die Wahrnehmungsfähigkeit zu unterstützen. Darüber hinaus enthält das neue System auch umfangreiche Weltwissen und App-Aktionen, und die Bildschirmwahrnehmungsfähigkeit wurde ebenfalls hinzugefügt.
In Bezug auf die konkreten Apps hat Apple Intelligence auch viele praktische Verbesserungen gebracht:
- Passwort-App: Kann Benutzern helfen, mehrere schwache Passwörter mit einem Klick zu aktualisieren.
- Messages: Kann den Chatkontext verstehen, Benutzer daran erinnern, etwas in die Erinnerungen oder Notizen aufzunehmen, und auch Benutzern helfen, Fotos zu finden, die im Chat erwähnt wurden.
- Phone App: Wird über eine neue Fähigkeit verfügen, den Gesprächskontext zu verstehen. Wenn ein Benutzer beispielsweise an eine Fluggesellschaft anruft, kann die App die Flugbestätigungsnummer und andere relevante Informationen abrufen.
- E-Mail-App und Kalender-App: Werden "kontextbewusster" werden. Beispielsweise kann die E-Mail-App passendere Vorschläge geben, und der Kalender kann direkt über natürliche Sprache Termine erstellen und automatisch die darin enthaltenen Kontakte, Orte und andere Informationen erkennen.
Laut Mike Rockwell, dem Vizepräsidenten der Apple Siri-Engineering, wird die neue Siri ein leistungsfähigeres Assistenten bieten und über eine eigene Siri-App verfügen.
Das Design hat auch die zuvor gerühmten Veränderungen übernommen: Die früheren farbigen Effekte, die am Bildschirmrand umliefen, wurden durch eine dunkle Themenoberfläche auf Basis der Dynamic Island ersetzt.
Die neue Siri zeigt auch die Bildschirmwahrnehmungsfähigkeit. Wenn ein Benutzer beispielsweise einen Instagram-Post sieht, kann er direkt nach dem im Post erwähnten Ort fragen. Siri kann auch Kontakte erkennen, ohne dass bei jedem Hinweis konkrete Informationen angegeben werden müssen. Mindestens aus den bisherigen Darstellungen geht hervor, dass die Funktionen der neuen Siri die Fähigkeiten erfüllen, die Apple vor zwei Jahren auf der WWDC 2024 demonstriert und ursprünglich mit iOS 18 geplant hatte.
Die Sprachfunktion der neuen Siri ist auch personalisierter. Sie bietet nicht nur voreingestellte Sprachoptionen, sondern auch mehr Optionen wie Sprechgeschwindigkeit und Tonfall.
Unter iOS kann der Benutzer Siri durch ein Abwischen von der Dynamic Island nach unten öffnen oder die bestehende Aufrufmethode verwenden. Auf dem Mac ist Siri jetzt mit Spotlight integriert, und das Menüleisten-Icon ist endlich monochrom statt farbig.
Apple hat besonders erwähnt, dass die neue exklusive Siri-App es Benutzern ermöglicht, vorherige Gespräche zurückzuerinnern und neue Gespräche zu beginnen. Die Gesprächsverläufe werden privat über iCloud synchronisiert, sodass die Gespräche nahtlos zwischen verschiedenen Geräten fortgesetzt werden können.
Googles "Gehirn" mieten, um Siri zu reparieren
Ein größerer Wandel ist, dass Apple nicht mehr vollständig auf selbst entwickelte Modelle setzt, um diese Einholjagd zu bestreiten.
Das Herzstück von Apple Intelligence sind die gemeinsam mit Google entwickelten Apple Foundation Models. Im Januar dieses Jahres kündigten Google und Apple ein mehrjähriges Kooperationsprogramm an. Gemäß diesem Programm wird das Google Gemini KI-Modell die Grundlage für Apples KI-System bilden.
Apple beschreibt diese Zusammenarbeit als "tiefe" Zusammenarbeit und nennt sie eine "große Aufrüstung" von Apple Intelligence, die die neuesten Verständnis- und Schlussfolgerungsfähigkeiten sowie multimodale Unterstützung, einschließlich Bildverstehen und -generierung, mit sich bringt.
Laut Gurman basiert diese Siri-Upgrade auf einem von Google maßgeschneiderten 1,2 Billionen Parameter-Modell, das jährlich etwa 1 Milliarde US-Dollar kostet.
Man muss bedenken, dass Apple als das Unternehmen mit der höchsten Marktkapitalisierung 147 Milliarden US-Dollar an Bargeld und Wertpapieren hält. Ein Unternehmen, das von den Siliziumscheiben bis zu den Schrauben alles selbst kontrolliert, eigene Chips und Modems herstellt, hat an dieser WWDC offiziell zugeben müssen: Sie werden keine führenden KI-Modelle selbst entwickeln. Sie wählen stattdessen, ein Modell von Google zu mieten. Dies sagt mehr über die Ökonomie der KI aus als jedes Benchmark in diesem Jahr.
Warum mieten und nicht selber bauen? Schauen Sie sich an, was es kostet, ein führendes Modell zu haben: OpenAI hat eine Betriebsgewinnspanne von -122%, Anthropic verbraucht nur für die Rechenleistung monatlich etwa 1,25 Milliarden US-Dollar, und ein Training eines führenden Modells kostet alle paar Monate eine neunstellige Summe an US-Dollar. Nach diesen Kosten hat Apple sich entschieden, auf die eigene Entwicklung zu verzichten.
Aber Apple hat nicht auf die Rechenleistung verzichtet. Die aufwändigen Gemini-Inferenzen laufen auf Apples eigenen Private Cloud Compute-Servern, nicht auf Googles Servern. Apple mietet die Modellgewichte, behält aber die Infrastruktur. Es zahlt Google für das Modell, behält aber die Kontrolle über die Rechenleistungsebene. Dies ist der wirklich wichtige Punkt dieser Wette.
Apple hat 2,5 Milliarden aktive Geräte. Ein Modell mit 1,2 Billionen Parametern steht hinter Siri und wird all diesen Geräten dienen. Dies bedeutet eine planetarische Skala an führenden Modellinferenzen. Es läuft in Rechenzentren, die auf Strom angewiesen sind - das Stromnetz ist derzeit nicht bereit, eine solche Belastung zu tragen.
Einige sind der Meinung, dass dies keine Kapitulation ist, sondern eine Einschätzung eines Bauers. Ein führendes Modell zu besitzen ist wie auf einem Laufband: Alle paar Monate muss man es neu trainieren, die meisten Inferenzen machen Verluste, und es kostet enorme Summen, den Modellservice aufrechtzuerhalten. Apple setzt darauf, dass Modelle zu Waren werden, und dass die Rechenleistungsebene unterhalb der Modelle, die Chips, der Strom und die Kühlsysteme, der eigentliche Wettbewerbsvorteil sind. Diese Dinge erweitern sich nicht nach dem Zeitplan der Software. Das wertvollste Unternehmen der Welt setzt darauf, dass führende Modelle kommerzialisiert werden und dass das eigentliche Problem alles unterhalb der Modelle ist.
Deshalb ist es schwierig, diese Zusammenarbeit einfach als Erfolg oder Misserfolg zu bewerten. Es ist eine seltene Kompromisslösung unter dem Druck der KI-Einholjagd.
Nach der Keynotespeech der WWDC erläuterte Craig Federighi in einem technischen Austausch mit der Medienbranche die Kooperationsgrenzen zwischen Apple und Google weiter.
Beim Gespräch über die Zusammenarbeit mit Google erklärte Federighi:
Naturgemäß verwenden wir die Gemini-App nicht als unsere eigene App. Tatsächlich verwenden wir beim Betrieb auf iOS keinen der Client-Codes. Bei diesen Modellen verwenden wir keine der Modelle, die Google an seine Kunden bereitstellt, und auch nicht die Infrastruktur und Methoden, die Google bei der Bereitstellung der Modelle an die Kunden verwendet. Was die Wissensbasis betrifft, verwenden wir natürlich auch nicht Google Search oder ähnliche Produkte als Grundlage für unser System. Ich hoffe, dass dies klar ist: Wir verwenden null Prozent Google Assistant.
Jetzt sprechen wir darüber, was wir tatsächlich verwenden, oder wie unser System aufgebaut ist.
Alles beginnt natürlich mit unserer Assistenten-Erfahrung. Wie Sie heute früh gesehen haben, ist diese Assistenten-Erfahrung tief in das System integriert, in iOS, iPadOS und macOS. Sie haben auf dem iPhone gesehen, wie der Assistent auf eine sehr schöne Weise in Form von Liquid Glass aus der Dynamic Island auftaucht. Sie können ihn über die Seitentaste aufrufen oder einfach den Namen Siri nennen, um ihn zu starten. Aber noch wichtiger ist, dass er in verschiedene Szenarien im System integriert ist. Egal, ob Sie mit den Schreibtools schreiben oder über das Kontextmenü agieren, alles ist tief mit der Systemerfahrung verbunden.
Der Zugang zu dieser Erfahrung ist die Siri-App. Die Siri-App ist ein guter Einstiegspunkt, um zu einem bereits begonnenen Gespräch zurückzukehren, zu sehen, was Sie zuvor getan haben, oder das Gespräch fortzusetzen oder ein neues zu beginnen. Aber diese App ruft nicht einfach ein Modell aus der Cloud auf. Sie basiert auf der starken Systemsoftware von Apple Intelligence.
Dazu gehört der System Orchestrator, der der Schlüssel für die gesamte System-Privatsphäre-Architektur ist. Er koordiniert verschiedene Anfragen, wie beispielsweise den Zugang zu Aktionen in Ihren Apps über die App Toolbox, den Zugang zu persönlichen Inhalten über die Spotlight Semantic Index, um Ihre Anfragen zu erfüllen, und kann sogar den Bildschirmkontext nutzen, um zu verstehen, was Sie möglicherweise gerade anschauen, wenn Sie eine Anfrage stellen.
All dies basiert auf einer