Apple übergibt Siri an Gemini: Was das für die Zukunft bedeutet

15 Jahre Siri: Apple vom Pionier zum Nachzügler.

Am 4. Oktober 2011 leitete Tim Cook zum ersten Mal als CEO von Apple eine Pressekonferenz – dies war auch die Premiere von Siri bei Apple.

Fünfzehn Jahre später, am 9. Juni 2026, stand Cook mitten auf der Bühne der WWDC (Worldwide Developers Conference von Apple). Die Außenwelt war sich einig, dass dies die letzte Entwicklerkonferenz während seiner Amtszeit sein würde. Siri war wieder im Mittelpunkt der Aufmerksamkeit.

Nur war es nicht mehr der gleiche Siri wie damals.

Obwohl die neue Version von Siri und andere neue künstliche Intelligenz-Funktionen von Apple aufgrund von Regulierungsanforderungen noch nicht auf dem chinesischen Festland verfügbar sein können, hat es viele Menschen aufgeregt. In einer Echtzeit-Demonstration konnte dieser „neue Siri“ in den meisten Szenarien direkt Chatverläufe abrufen, indizieren und lesen, Aufgaben über Anwendungen hinweg ausführen und Browser-Plugins und Schnellbefehle mithilfe natürlicher Sprache generieren.

Was ihn jedoch denken lässt, beruht nicht mehr ausschließlich auf Apples eigenen Fähigkeiten. Auf der Pressekonferenz führte Apple erstmals klar aus, dass Google Gemini in die Apple Foundation-Architektur integriert wird. Laut Bloomberg muss Apple dafür Google jährlich 1 Milliarde US-Dollar zahlen.

● Apples dritte Generation von Apple Foundation Models (AFM). Quelle: Screenshot der Pressekonferenz

Zur gleichen Zeit führte Apple das Core AI-Framework ein, über das auch Drittanbieter-Modelle wie ChatGPT und Claude in Siri und das Apple-System integriert werden können.

In den letzten fünfzehn Jahren hat Siri stets Apples Verständnis von Künstlicher Intelligenz repräsentiert: geschlossen, eigenentwickelt, vorsichtig. Alle Fähigkeiten wuchsen innerhalb des Apple-Ökosystems. Die im Jahr 2024 von Apple erstmals vorgeschlagene Apple Intelligence-Idee war ebenfalls ein vollständig eigenentwickeltes AI-Architekturkonzept. Doch im Wettlauf um die besten AI-Modelle konnte Apple nicht an die Spitze kommen.

Vor fünfzehn Jahren hat Siri die Ära der Sprachassistenten eingeleitet; fünfzehn Jahre später ist es wieder Zeuge eines Wendepunkts in Apples Schicksal. Diesmal ist Apple jedoch nicht mehr der Pionier, sondern der Jäger.

Der neue Siri

Bei dieser Jahres-WWDC sprach Apple während eines Großteils der Pressekonferenz über Künstliche Intelligenz.

Auf der Bühne stand Mike Rockwell. Dieser Manager, der lange Zeit für die Systemarchitektur von Vision Pro verantwortlich war, übernahm Anfang 2025 das Projekt zur Neugestaltung von Siri. Apple zeigte ein neues AI-Konzentrisches-Kreis-System: Der Benutzer befindet sich im Zentrum, in der mittleren Schicht befinden sich multimodale und Ausführungstools, und in der äußersten Schicht sind Siri, die Software und das Systemökosystem.

● Apples neues AI-Architekturkonzept. Quelle: Screenshot der Pressekonferenz

Die neuen Funktionen von Siri lassen sich grob in Bildschirmwahrnehmung, Bildverständnis, Textverarbeitung, Anwendungs-Kooperation und andere Bereiche einteilen. Benutzer müssen nicht mehr zwischen verschiedenen Anwendungen hin und her wechseln: Wenn man ein Bild sieht, kann man direkt den Standort des Bildes erkennen; wenn man eine Adresse sieht, kann man Siri direkt bitten, eine Route zu planen; beim Surfen im Internet kann man direkt Text auswählen und Siri Fragen stellen; wenn man eine Veranstaltungs-Einladung erhält, kann man Siri direkt bitten, das Datum zu erkennen und es in den Kalender einzufügen.

Der Schwerpunkt dieser Veränderung liegt nicht darin, dass Siri klüger wird, sondern darin, dass er reibungsloser und bequemer wird. Auf einem Mac kann der Benutzer direkt mehrere Dateien auswählen und Fragen stellen, ohne sie hochzuladen; auf einem iPhone kann man über die Kamera direkt Siri Fragen zu Objekten in der realen Welt stellen; in Anwendungen wie Fotos, E-Mails, Notizen und Safari wird die KI direkt in den bestehenden Arbeitsablauf integriert, um beispielsweise das Layout von aufgenommenen Fotos neu einzustellen, Browser-Tabs zu organisieren und Korrektur- und Optimierungsfunktionen über die Tastatur jederzeit aufzurufen.

● Der Aufruf von Siri auf iPhone und Mac. Quelle: Screenshot der Pressekonferenz

Wichtiger noch ist, dass die Logik des alten Siri auf Ein-Runde-Fragen-Antworten basierte, während das neue System beginnt, zu verstehen, was der Benutzer „gerade tut“. Es kann je nach Gesprächspartner und früheren Chatverläufen unterschiedliche Gesprächs-Töne annehmen, auf der Grundlage von E-Mail-Inhalten aktive Vorschläge für die nächste Aktion geben oder im Szenario über Anwendungen hinweg die Absicht des Benutzers vorhersagen und somit den Ausführungsweg im Voraus angeben.

Apple versucht, Siri neu zu definieren und ihn von einem Kundenbetreuer in ein Steuerungszentrum zu verwandeln, und hat eine unabhängige Siri-Anwendung eingeführt. Dies bedeutet auch, dass Apple viele seiner früheren Überzeugungen aufgegeben hat: Es wollte ursprünglich keine Chat-Bots entwickeln, jetzt hat es es getan; es war ursprünglich zurückhaltend gegenüber der Verwendung von KI zur Bildbearbeitung, jetzt hat es dies auch eingeführt.

In der Vergangenheit schwankte Apple zwischen der Entscheidung, ob Siri eigenentwickelte Modelle oder externe Modelle verwenden sollte. Jetzt hat das Team das Konzept der vollständigen Eigenentwicklung von Apple Foundation Models aufgegeben und sich stattdessen für die Integration externer Technologien entschieden. Unter den drei Unternehmen Google, Anthropic PBC und OpenAI, mit denen es über eine Zusammenarbeit verhandelte, hat Apple schließlich Google gewählt.

Die heutige dritte Generation von Apple Foundation Models umfasst 2 Endgeräte-Modelle und 3 Modelle, die auf einer privaten Cloud-Computing-Plattform laufen. Mehrere davon werden mithilfe des Google Gemini-Modells „verfeinert“. Das lokale Modell und die private Cloud-Architektur dienen dazu, sicherzustellen, dass die Daten nicht von Apple und anderen Drittanbietern zugänglich sind.

Das Signal, das diese Jahres-WWDC aussendet, ist, dass Siri gelernt hat, den Bildschirm zu sehen, Webseiten zu zusammenfassen und Fotos zu verstehen. Wichtiger noch ist jedoch die strategische Wende von Apple: In der Ära der Künstlichen Intelligenz ist es nicht mehr darauf fixiert, Anbieter von Grundlagen-Fähigkeiten zu sein, sondern neigt eher dazu, Organisator dieser Fähigkeiten zu werden.

Von der Vernachlässigung bis zur großen Erwartung

Zurück in das Jahr 2011 war Siri noch ein Produkt mit viel Vorstellungskraft. Sein Anfang lag nicht bei Apple, sondern bei der von Siri.Inc entwickelten unabhängigen App, die 2010 im App Store verfügbar wurde und als „persönlicher Sekretär“ positioniert war, der Ihnen helfen konnte, Restaurants zu buchen, das Wetter zu checken und Informationen zu integrieren. Die Basis-Technologie stammt aus einem Projekt zur Entwicklung von virtuellen Agenten, das von der US-amerikanischen Defense Advanced Research Projects Agency seit 2003 mit einem Betrag von etwa 150 Millionen US-Dollar gefördert wurde.

Drei Wochen nach der Verfügbarkeit von Siri interessierte sich Apple-Gründer Steve Jobs für sie und lud die Gründer zu einem Treffen ein. Zwei Monate später kündigte Apple an, Siri für 200 Millionen US-Dollar zu erwerben und es in das 2012 veröffentlichte iPhone 4S zu integrieren, wo es zu einer der wichtigsten Funktionen des Geräts wurde.

Von 2011 bis 2015 waren die Updates von Siri jedoch fast immer nur kleine Anpassungen, wie die Erweiterung der Mehrsprachigkeit, die einfache Informationssuche, die Einbindung von Enzyklopädie-Inhalten, die Aktivierung von „Hey Siri“ usw. Selbst in iOS 15 löschte Apple sogar Funktionen aus Siri, die sich auf Notizen, Fotos, Taxibestellungen, Zahlungen usw. bezogen. Bis heute ist die am häufigsten genutzte Funktion von Siri immer noch die, die es bereits bei seiner Premiere 2011 hatte – einen Wecker einzustellen.

Siris technischer Schutzwall war nicht sehr stark. 2012 war die Funktion von Samsung S Voice bereits der von Siri ähnlich; in einem Vergleichstest im Jahr 2014 übertraf Google Now Siri in Bezug auf die Informationsverstehens- und Empfehlungsfähigkeit; bis 2017 beurteilte die US-amerikanische Tech-Medienplattform The Verge Siri direkt als „deutlich hinter der Zeit zurückgeblieben“. Seine Vorsprungsphase war tatsächlich sehr kurz.

2018 veröffentlichte die US-amerikanische Tech-Medienplattform The Information einen ausführlichen Bericht über die Veränderungen im Siri-Team. Laut den Erinnerungen ehemaliger Mitarbeiter war Siri in der Anfangsphase noch nicht richtig vorbereitet, als es auf den Markt kam. Die Backend-Architektur war nicht auf den großen Benutzerstrom ausgelegt. Ein Apple-Mitarbeiter schrieb später einen Code neu, wodurch der Serverbedarf für eine Backend-Komponente von etwa 500 auf 5 Server reduziert wurde.

Innerhalb von Apple war sich auch nicht einig, wie Siri positioniert werden sollte. Eine Gruppe war der Meinung, dass der Kern von Siri die Suche und das Abrufen von Informationen sein sollte, während die andere Gruppe bestand, dass Siri ein echter Assistent werden muss.

Ein ehemaliger Apple-Mitarbeiter sagte: „Jobs starb am Tag nach der Einführung von Siri, und Apple verlor dadurch seine Richtung.“ Daher war die Entwicklung von Siri lange Zeit in einem gespaltenen Zustand. Ein Teil des Teams war für die Spracherkennung zuständig, ein anderer Teil für die Systemintegration und ein weiterer Teil für die Optimierung der Benutzererfahrung. Unter diesen Umständen arbeitete das Siri-Team getrennt voneinander und fehlte eine einheitliche Entwicklungslogik.

Diese Spaltung erstreckte sich auch auf das Produkt. Das Siri-Team erfuhr erst 2015, dass Siri in den HomePod integriert werden würde. Damals hat Apple, um mit dem Ende 2014 von Amazon veröffentlichten Echo zu konkurrieren, Siri in das Projekt hineingedrängt. Nach der Veröffentlichung beurteilte die New York Times: „Der Siri auf dem HomePod ist peinlich schlecht.“ Die schlechte Marktleistung des HomePod wurde von Teilen des internen Teams auch auf die mangelnden Fähigkeiten des Siri-Teams zurückgeführt.

● Der 2017 von Apple veröffentlichte intelligente Lautsprecher „HomePod“ mit integriertem Siri. Quelle: Unsplash

Zur gleichen Zeit war Siri von Datenschutzkontroversen geplagt. 2019 wurde Siri beschuldigt, aufzuzeichnen, wenn der Benutzer es nicht aktiviert hatte, und die Aufnahmen an ausgelagerte Dienstleister zur manuellen Überprüfung zu senden, was zu einem Kollektivprozess führte. Anfang 2025 billigte das US-amerikanische Gericht in Kalifornien die von Apple geschlossene Vergleichsvereinbarung. Schließlich bekamen die berechtigten Benutzer pro Gerät eine Entschädigung von etwa 8,02 US-Dollar, wobei die maximale Entschädigung pro Person 40,1 US-Dollar betrug.

Das Siri-Projekt hat innerhalb von Apple auch mehrmals eine Anpassung der Leitung erfahren. Vom Anfang an, als es von dem iOS-Team geleitet wurde, bis 2012, als Bill Stasior ein unabhängiges Team gründete, bis 2018, als das Machine-Learning-Team eingriff...

Erst mit der Welle der generativen KI wurde Siri wieder wichtig. Der Wendepunkt im Schicksal des neuen Siri lag in einer Sitzung Anfang 2025. Diese Sitzung versammelte die meisten Kernleiter von Apple, mit Ausnahme von CEO Cook. Die Sitzung stellte fest, dass die Leistung von Apple Intelligence nicht den Erwartungen entsprach und dass die Weiterentwicklung der neuen Generation von Siri verzögert werden würde.

Damals verlor Cook Vertrauen in John Giannandrea, den damaligen Leiter der KI. Rockwell, der die Entstehung des neuen Produkts Vision Pro geleitet hatte, bot sich freiwillig an, das Siri-Projekt zu übernehmen.

Danach brachte Rockwell das Team, das zuvor für Vision Pro und das VisionOS-Betriebssystem verantwortlich war, als neues Siri-Team und startete sofort das Projekt zur Verwendung von Drittanbieter-Modellen. So wurde die neue Richtung von Siri festgelegt.

Von der Softwareentwicklung zurück zum Hardware-Geschäft

Bei dieser Zusammenarbeit mit Google muss Apple jährlich etwa 1 Milliarde US-Dollar an Google zahlen, um seine KI-Technologie und Infrastruktur-Kapazitäten zu nutzen.

In den letzten zwanzig Jahren hat sich Apples Technologiepfad fast auf die Prinzipien der Eigenentwicklung von Chips, Betriebssystemen und Diensten gestützt. Die offizielle Erklärung für die Verwendung von Gemini ist, dass es nach einer technischen Bewertung das „leistungsfähigste Basis-Modell“ zurzeit bietet.

2022 hat das interne Team von Apple mehrere große Sprachmodelle entwickelt, die jedoch aufgrund von Bedenken der Unternehmensleitung hinsichtlich ihrer „Nutzbarkeit“ auf Eis gelegt wurden. Seitdem war Apples Engagement in der KI auch eher bescheiden. Im Geschäftsjahr 2025 (September 2024 bis September 2025) beliefen sich die Forschungs- und Entwicklungsausgaben auf etwa 34,5 Milliarden US-Dollar, während Meta in der gleichen Zeit etwa 57,372 Milliarden US-Dollar und Google etwa 61,087 Milliarden US-Dollar ausgab.

Nach mehreren Verzögerungen bei Siri hat Apple im Wesentlichen seine Hartnäckigkeit bei der Entwicklung eines Full-Stack-Großmodells aufgegeben und sich stattdessen auf seine Stärken im Hardware-Ökosystem konzentriert. Der beliebte Kandidat für den nächsten Apple-CEO, John Ternus, ist derzeit auch der Senior-Vizepräsident für Hardware-Engineering bei Apple.

Für Apple ist der alte Weg stabiler und sicherer. Selbst wenn es nicht das Modell selbst besitzt, kann es immer noch von der Verteilungsebene profitieren. Berichten zufolge hat Apple 2025 allein über den App Store fast 900 Millionen US-Dollar an Provisionen von generativen KI-Anwendungen eingenommen, und 2026 wird ein Überschreiten der 1 Milliarde US-Dollar erwartet.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Apple hat Siri an Gemini übergeben

Der neue Siri

Von der Vernachlässigung bis zur großen Erwartung

Von der Softwareentwicklung zurück zum Hardware-Geschäft