Apples KI sorgt spät in der Nacht für Aufsehen: Siri ist endlich nicht mehr „geistig behindert“, Gemini hat seine „Herztransplantation“ erfolgreich hinter sich
Die seit langem von allen "erwartete" Keynote der WWDC26 ist endlich vorbei. Lei Technology hat die gesamte Pressemitteilung verfolgt. Zunächst die wichtigsten Punkte: Die im Folgenden zu besprechenden neuen Funktionen der KI (Apple Intelligence, Siri AI) haben derzeit nichts mit chinesischen Endbenutzern und nationalen Apple-Geräten zu tun. Diese KI-Aktualisierung wird wie bisher "um China und die EU herum" veröffentlicht.
Bildquelle: Apple
Allerdings, wenn Sie ein ausländisches Handy mit einem ausländischen Apple ID verwenden, kann man sagen, dass diese Apple Intelligence-Aktualisierung "reichlich und sättigend" ist. Sie bringt die Funktionen von Apple Intelligence nicht nur auf das Niveau der derzeit aggressivsten KI-Agent-Handys, sondern setzt auch aufgrund der ganzheitlichen Plattformökosystemfähigkeiten von Apple und des Strebs nach Datenschutz eine "Kombination" mit Apple-Eigenheiten um. Für die meisten nationalen Benutzer kann man sich zumindest "mit der Hoffnung trösten", falls Apple Intelligence eines Tages tatsächlich im Kreislauf von "Erwartung - Enttäuschung - Erwartung" eintrifft.
"Herztransplantation" mit Google Gemini, Apple hat auch eigene Ideen
Lassen Sie uns zunächst das neue Apple Intelligence-Modell besprechen. Wie bei der zuvor groß angelegten "Vorwegnahme" wurde das neue Apple Foundation Model (im Folgenden kurz AFM) auf der Grundlage des Gemini Foundation Models (derzeit noch unklar, welche Generation) entwickelt, anstatt direkt das Gemini zu verwenden.
Wenn Sie diese Beziehung nicht verstehen, macht Lei Technology Ihnen ein Beispiel:
Restaurant A hat es mit der Kochkunst nicht gut und findet, dass die Gerichte von Restaurant G recht gut sind. Also kauft es von Restaurant G ein komplettes Rezeptbuch (Gemini Foundation Model) und passt es nach eigenem Verständnis und verbessert es zu seinem eigenen Rezeptbuch (AFM).
Aber dieses Rezeptbuch ist ein Einmalgeschäft. Wenn Restaurant G später sein Rezeptbuch anpasst, ist es nicht verpflichtet, Restaurant A mit den nachfolgenden Aktualisierungen und Support zu versorgen. Alles hängt von Restaurant A selbst ab.
In den Händen von Apple hat sich dieses eingeführte und "privatisierte" Foundation Model in zwei Modi (Zweige) aufgeteilt - es kann direkt auf Geräten wie iPhone, iPad und Mac laufen oder auf Apples privaten Cloud-Computing-Servern. Mit anderen Worten, die neue Apple Intelligence folgt weiterhin dem Hybrid-Modellansatz, aber es ist nicht mehr wie zuvor bei der Integration von ChatGPT, wo alles von der API von OpenAI abhängig war.
Bildquelle: Apple
Offensichtlich kann diese Kombination aus einem Geräte-seitigen Großmodell und einem privaten Cloud-Computing-Modell die Benutzerdaten in einem von Apple kontrollierbaren Bereich halten und so die Privatsphäre der Benutzer schützen. Laut Apple kann es die Benutzerdaten nicht zugreifen, und diese werden nur zur Reaktion auf Benutzeranfragen verwendet.
Außerdem hat Apple ein stärkeres zweites "Geräte-seitiges Modell" (nicht das zuvor erwähnte AFM) vorgestellt, das bessere multimodale Fähigkeiten bietet.
Bildquelle: Apple
Dementsprechend bieten iOS, iPadOS und macOS auch ein reichhaltigeres systemseitiges Support für die neue Apple Intelligence, sodass diese in alle Aspekte des "Apple-Ökosystems" integriert werden kann.
Und all diese neuen Technologien bringen den Benutzern das erste "Hauptgericht", natürlich die neue Siri.
Nach der KI-Ansteuerung hat Siri endgültig das "Sprachdummsein" hinter sich gelassen
Beim Namen ist diese von Apple Intelligence angetriebene neue Siri ziemlich unkreativ und heißt einfach "Siri AI". Aber in Bezug auf die Interaktionsweise, die Verständnisfähigkeit usw. hat sich Siri AI erheblich verbessert.
Zunächst hat Apple endlich eine unabhängige App für Siri AI entwickelt, ähnlich wie ChatGPT, Gemini, Grok App. Benutzer können so in einem einheitlichen Eingang die vollständigen Interaktionsaufzeichnungen von Siri AI einsehen.
Bildquelle: Apple
Außerdem wurde auf der WWDC26 die bereits online aufgetauchte "Dynamic Island Siri"-Oberfläche bestätigt. iPhone-Benutzer können neben dem langen Drücken der Seitentaste und "Hey Siri" auch durch Herunterziehen der oberen Leiste Siri aktivieren.
Bildquelle: Apple
Was die Fähigkeiten betrifft, hat die neue Siri AI nun die Fähigkeiten von "Wahrnehmung", "Verständnis", "Aufruf" und "Ausführung".
Lassen Sie uns zunächst die "Wahrnehmung" besprechen. Dank der Verbesserung der multimodalen Fähigkeiten von AFM kann die neue Siri AI jetzt nicht nur die Worte der Benutzer "hören", sondern auch den Inhalt, der von der Kamera aufgenommen und auf dem Bildschirm angezeigt wird, "sehen". Diese "Wahrnehmung" ist nicht nur auf Texte beschränkt, sondern auch Bilder können eingegeben werden. Natürlich wird die Sprachwahrnehmungsfähigkeit von Siri AI auch nicht vernachlässigt.
Bildquelle: Apple
Apple hat in der WWDC-Keynote nicht die genauen Mittel zur Wahrnehmung von Bildern durch Siri AI offen gelegt. Lei Technology kann auch nicht sagen, ob Siri wie Android-Handys auf der Grundlage von Bildschirmaufnahmen und GUI-Agenten arbeitet oder ob Apple als erster Anbieter eine neue API für Siri AI bereitstellt.
Nach der Wahrnehmung des Bildschirminhalts kann Siri AI diesen Inhalt verstehen und darauf reagieren, z. B. kann es den Aufnahmeort anhand von Reisebildern suchen, die Kosten pro Person anhand einer Speiserechnung berechnen oder die Nährwerte von Lebensmitteln schätzen.
Was die Ausführung betrifft, hat Apple tatsächlich seinen "Heimvorteil" voll ausgenutzt: Siri AI kann direkt mit den wahrgenommenen Informationen komplexe Aufgaben erstellen, z. B. direkt einen "Drei-Tage-Zwei-Nächte"-Reiseplan zum Aufnahmeort erstellen. Es kann auch direkt mehrere System-Apps aufrufen, um die entsprechenden Aktionen auszuführen (die Unterstützung von Drittanbieter-Apps ist unbekannt).
Auf macOS hat Siri AI auch noch umfangreichere Fähigkeiten freigeschaltet und kann direkt mehrere Dokumente vergleichen, zusammenfassen und bearbeiten, ganz wie ein KI-Agent-Client.
Bildquelle: Apple
Interessanterweise hat Apple nach den früheren "auswählbaren Stimmen" auch eine neue Funktion zur Anpassung der Stimme für Siri AI bereitgestellt: Benutzer können direkt durch "Ziehen der Schieberegler" die Stimme, die Tonlage und die Sprechgeschwindigkeit von Siri AI anpassen und so eine "eigenständige" Siri AI schaffen.
Bildquelle: Apple
In Bezug auf die unterstützten Sprachen unterstützt Siri AI derzeit Englisch und wird in Zukunft mehrere Sprachen außer Chinesisch (vereinfacht und traditionell) anbieten. Aber wie wir am Anfang erwähnt haben, wird diese Siri AI-Aktualisierung wie bisher "um China und die EU herum" durchgeführt, und die nationalen Benutzer müssen weiterhin "auf die Benachrichtigung warten".
Nicht nur Siri, auch Safari und Shortcuts profitieren von KI
Als "epochemachendes" Werk von Apple Intelligence hat Apple auch die vier Kernfähigkeiten der KI ("Wahrnehmung", "Verständnis", "Aufruf", "Ausführung") in alle Aspekte anderer Apps integriert.
Zum Beispiel kann der neue Safari nach der Integration von Apple Intelligence die geöffneten Tabellen "intelligent gruppieren". Dies ist für die Lei Technology-Redakteure, die immer Hunderte von Tabellen zum Recherchieren geöffnet haben, äußerst praktisch.
Basierend auf der multimodalen Wahrnehmungsfähigkeit von Apple Intelligence kann der Safari mit KI-Fähigkeiten jetzt auch im Hintergrund eine bestimmte Webseite intelligent überwachen und Benachrichtigungen an die Benutzer senden, wenn der Inhalt der Webseite aktualisiert wird. Für Benutzer, die "Web-Tickets kaufen" müssen, ist diese Funktion sehr praktisch.
Das ist noch nicht alles. Wir wissen, dass Safari Drittanbieter-Plugins installieren kann, und die neue Apple Intelligence bietet den Benutzern die Funktion, "eigene Browser-Plugins" zu erstellen: Benutzer müssen Safari nur in natürlicher Sprache sagen, "welches Plugin benötige ich? Welche Funktionen soll es haben?" Safari kann dann mit KI ein Plugin erstellen, das Ihren Anforderungen entspricht.
Bildquelle: Apple
Ja, Safari spielt auch mit "Vibe Coding".
Das gleiche gilt für die neuen "Shortcuts": Früher mussten wir, um einen Shortcut zu erstellen, in der "unendlichen" Liste die Trigger- und Ausführungskomponenten auswählen und dann die vollständige Laufzeitlogik mit der Genauigkeit von Programmieren schreiben. Selbst Xiao Lei muss zugeben, dass dieser komplizierte und anspruchsvolle Prozess viele Benutzer abgeschreckt hat und auch die so nützliche App "Shortcuts" verschwendet hat.
Aber seit die Shortcuts Apple Intelligence integriert haben, müssen wir nur unsere tatsächlichen Anforderungen in natürlicher Sprache ausdrücken, z. B. "Wenn ich in 5 Minuten einen Auslandstermin habe und keine Flug- oder Zugtickets in der Reiseinformation stehen, öffne automatisch die Klimaanlage im Auto". Die Shortcuts werden dann innerhalb ihrer Fähigkeiten automatisch die Ausführungsmöglichkeiten aller Apps (einschließlich Drittanbieter-Apps) suchen und automatisch eine Ausführungsdatei generieren. Danach können wir sie direkt verwenden.
Bildquelle: Apple
Das in China wenig bekannte "Apple Home"-Smarthome-System hat auch eine Aktualisierung erhalten: Für Benutzer, die HomeKit-Kameras installiert und die entsprechende Dienstleistung aktiviert haben, kann die Home-App die Überwachungsbilder im Hintergrund analysieren und in Text zusammenfassen; sie kann auch direkt den entsprechenden Videoclip finden, wenn der Benutzer danach fragt.