StartseiteArtikel

Warum können wir noch immer keine AI-Smartphones nutzen?

星海情报局2026-04-29 20:56
Warum muss dein AI-Smartphone überhaupt ein Smartphone sein?

Im Jahr 2007 sagte Steve Jobs auf einer Pressekonferenz, dass das iPhone ein „revolutionäres Mobiltelefon“ sei.

Das stimmt, aber wenn Jobs noch leben würde, würde er wahrscheinlich denken, dass diese Revolution noch nicht vollständig genug ist.

Die Entwicklung von Mobiltelefonen scheint auf den ersten Blick so zu sein, dass „Technologie Veränderungen in der Ökosysteme bringt, und diese Veränderungen wiederum Verhaltensänderungen der Verbraucher bewirken“. Wenn man aber einen Schritt zurücktritt, erkennt man eine tiefere Logik hinter dieser Linie: Die Beziehung zwischen Menschen und Mobiltelefonen hat sich qualitativ verändert, und die Grenze zwischen Menschen und Maschinen wird immer verschwommener.

In der Nokia-Ära war das Mobiltelefon ein Kommunikationsmittel. Man benutzte es, um Anrufe zu tätigen und SMS zu senden, und seine Präsenz endete, sobald man es nicht mehr in der Hand hielt.

Nach der Entstehung des iPhones ist das Mobiltelefon zu einem „externen Organ“ geworden. Es erweitert Ihr Gedächtnis (Notizen, Fotoalben), Ihre Wahrnehmung (Karten, Suchmaschinen) und Ihre soziale Interaktion (WeChat, WeiBo). Heute ist es beinahe unmöglich, ohne Mobiltelefon aus dem Haus zu gehen, und Tage ohne Mobiltelefon erscheinen unendlich lang – es ist bereits unser „siliziumbasiertes Organ“ geworden.

Jetzt will das AI-Mobiltelefon einen dritten Sprung vollführen: Vom „externen Organ“ zum „Doppelgänger“ werden – das Mobiltelefon bekommt eigene Urteilsfähigkeit, und Sie müssen nur einen vagen Befehl geben, der Rest wird es für Sie erledigen. Machen Sie sich keine Sorgen, seit der Entstehung von KI ist dies der Trend, solange die Technologie voranschreitet.

Das erste Mobiltelefon kostet nur Ihr Geld, das zweite kostet nicht nur Ihr Geld, sondern auch Ihre Aufmerksamkeit, und das dritte kostet nicht nur Geld und Aufmerksamkeit, sondern auch etwas von Ihrer Macht.

Der wesentliche Unterschied zwischen dem dritten „Doppelgänger“ und dem zweiten „externen Organ“ besteht darin: Das „externe Organ“ wartet auf Ihren Befehl, während der „Doppelgänger“ für Sie nachdenkt.

Warum reicht eine Software-Upgrade nicht aus

Eine vernünftige Frage ist: Anstatt neue Mobiltelefone zu entwickeln, warum können wir nicht einfach ein AI-Update für alte Mobiltelefone veröffentlichen, um diese Funktionen zu realisieren?

Weil ein echter AI-Erlebnis erfordert, dass drei Dinge gleichzeitig geschehen, und ein Software-Upgrade kann diese drei Dinge nicht bieten.

Erstens die Rechenleistung auf der Geräte-Seite.

Wenn man ein AI-Mobiltelefon entwickeln will, muss das Large Language Model lokal installiert werden, und es muss nicht nur ein Textmodell sein. Es muss in der Lage sein, Sprache, Bilder, Texte und Videos zu verstehen und zu inferieren, und diese Fähigkeit darf nicht von einem Netzwerk abhängen – d.h. es muss in der Lage sein, Sprache, Bilder und Texte offline in Echtzeit zu verarbeiten und intermodale Inferenzen zu treffen.

Um eine solche Fähigkeit zu realisieren, benötigt man eine spezielle NPU (Neural Processing Unit).

Was ist dann die Größenordnung der NPU, die für das Ausführen eines brauchbaren Large Language Models auf der Geräte-Seite erforderlich ist?

Die Antwort lautet: Es gibt keine Obergrenze.

Der 16-Kern-Neural Engine des Apple A18 kann 35 Billionen Operationen pro Sekunde ausführen, und die NPU-Rechenleistung des MediaTek Dimensity 9400 ist etwa doppelt so hoch. Dies ist die Leistung der besten Chips, die man heute kaufen kann.

Vor nur drei oder vier Jahren war die NPU-Rechenleistung des Snapdragon 8 Gen 1 nur etwas mehr als ein Zehntel der heutigen besten Chips, und die NPU des Snapdragon 8 Gen 2 ist bereits mehr als viermal so schnell wie die des 8 Gen 1, und der 8 Gen 3 ist wiederum fast doppelt so schnell wie der 8 Gen 2.

Deshalb muss man ein AI-Mobiltelefon von Grund auf neu entwickeln – die NPU-Design der alten Chips ist nicht für Aufgaben in der Größenordnung von „intermodaler Inferenz auf der Geräte-Seite“ ausgelegt, genauso wie man nicht mit einem Fahrrad die Geschwindigkeit eines Formel-1-Rennwagens erreichen kann.

Zweitens die Speicherbandbreite.

Hier muss man ein Prinzip erklären, das viele Menschen übersehen: Bei der Inferenz eines Large Language Models liegt der echte Engpass oft nicht in der Berechnung, sondern im Datenverkehr. Jedes Mal, wenn das Modell ein Wort generiert, muss es Milliarden von Parametern aus dem Speicher in den Prozessor laden – dieser Prozess heißt KV cache Lesen und Schreiben.

Wenn die NPU sehr stark ist, aber der Speicher nicht schnell genug ist, muss sie einfach warten. Nehmen wir ein vereinfachtes 7 Milliarden (7B) Parameter Large Language Model als Beispiel. Die minimal akzeptable Inferenzgeschwindigkeit beträgt etwa 19 Wörter pro Sekunde, und dies erfordert bereits den neuesten Speicherstandard. Vor ein oder zwei Jahren war die Speichergeschwindigkeit der besten Mobiltelefone nur die Hälfte oder sogar weniger der heutigen, und wenn man es etwas sagen lassen wollte, würde es wie Xie Ruolin ein Wort nach dem anderen ausstoßen.

Das ist die Folge einer unzureichenden Speicherbandbreite: Das Large Language Model auf der Geräte-Seite kann entweder nicht laufen oder ist so langsam, dass es keine praktische Verwendung hat.

Drittens, und das ist das Wichtigste: Die Zugriffsarchitektur des Betriebssystems.

Das Systemdesign traditioneller Smartphone schließt jede App in eine eigene Sandbox ein, und sie können nicht frei auf die Daten der anderen zugreifen. Wenn sie Daten anderer Apps verwenden möchten, müssen sie uns um die Berechtigung bitten.

Dieses Design schützt die Sicherheit, aber es blockiert auch grundsätzlich die Möglichkeit, dass KI „alles verbinden“ kann.

Das liegt daran, dass ein echter AI-Assistent den Kalender aufrufen, E-Mails lesen, Karten bedienen und Nachrichten senden muss. Dies erfordert eine Neudesign der Zugriffsmodell auf OS-Ebene. Als Ihr Doppelgänger muss er Ihre Berechtigungen haben, und das kann nicht durch ein einfaches Patch behoben werden – selbst ein Kaiser in der alten Zeit konnte nicht einfach mit einem Dekret einen Minister zum Sonderbeauftragten ernennen. Er musste ihm auch einen Titel wie „Kanzler mit gleichen Rechten wie der Kaiser“ oder „Befehlshaber mit vollem Machtumfang“ geben und ihm erlauben, sein eigenes Amt zu eröffnen und sein eigenes Team aufzubauen.

Deshalb ist die Entwicklung eines AI-Mobiltelefons ein Systemprojekt, das Software und Hardware koordiniert. Chip, Speicher, OS, Modell – jede Ebene muss neu entworfen werden, damit die Idee des „Doppelgängers“ technisch möglich wird. Andernfalls ist es höchstens ein AI-Large Language Model mit vielen Funktionen, aber kein echtes AI-Mobiltelefon.

Das größte Hindernis ist nicht die Technologie, sondern die Ökosystem

Technologische Herausforderungen können mit Geld und Zeit gelöst werden, also sind sie eigentlich kein echtes Hindernis.

Das echte Problem verbirgt sich in der kommerziellen Ökosystem.

Ende 2024 hat ByteDance in Zusammenarbeit mit ZTE das Doubao-Mobiltelefon (Nubia M153) vorgestellt. Seine Technologie ist ziemlich radikal: Die KI erkennt direkt den Bildschirminhalt über einen GUI-Agenten und simuliert die Handbewegungen, um die Einschränkungen der traditionellen API zu umgehen. Theoretisch kann es Ihnen helfen, Lebensmittel zu bestellen, Nachrichten zu senden und Flugtickets zu buchen, und es kann die Grenzen jeder App überschreiten. Die Prototypen waren sofort ausverkauft und wurden auf das Zehnfache des Originalpreises versteigert.

Dann war es aber auch schon vorbei. Dieses Mobiltelefon wurde von WeChat, Taobao und verschiedenen Banken fast gemeinsam boykottiert.

Der Grund ist einfach: Ein solches Mobiltelefon berührt das Kerninteresse fast aller Internetplattformen – die Monetarisierung von Daten.

Jede Super-App ist im Wesentlichen eine Datenkollektionsmaschine. WeChat weiß, mit wem Sie täglich chatten, Taobao weiß, was Sie letzten Monat gekauft haben, Meituan weiß, in welchem Viertel Sie wohnen, und Douyin weiß, welche Inhalte Sie gerne sehen... Solange diese Daten in den Händen der Plattformen sind, können die Plattformen Ihr Profil erstellen und Ihnen gezielt Werbung schicken, um die Effizienz der Monetarisierung direkt zu erhöhen – die Dinge, die auf Taobao für mich vorgeschlagen werden, und die Geschäfte, die auf Meituan empfohlen werden, sind völlig anders als die auf meinem Ehefrau's Handy. Dieselbe Plattform erhebt unterschiedliche „Traffic-Steuern“ für unterschiedliche Benutzerprofile, und so werden die Daten Schritt für Schritt monetarisiert.

Jetzt, wenn der AI-Assistent auf dem Mobiltelefon diese Daten frei verwenden kann, wird die Situation völlig anders.

Weil die KI eigene Gedanken hat, wird sie nicht nach den Algorithmen der Plattformen rechnen. Heute ist Donnerstag, und die Plattform würde Ihnen vielleicht nach dem Algorithmus KFC empfehlen, aber die KI könnte Ihnen stattdessen ein Leichtmahl wie ein Salat empfehlen, weil sie kürzlich Ihren Gesundheitsbericht analysiert hat.

Verstehen Sie, warum die Großkonzerne das AI-Mobiltelefon gemeinsam boykottieren?

Bei einem AI-Mobiltelefon erfolgen alle Empfehlungen auf der AI-Oberfläche des Mobiltelefons, nicht in der Meituan-App. Der Benutzer muss nicht die Meituan-App öffnen, um Empfehlungen zu erhalten, und die Empfehlungsmaschine von Meituan und die Beziehung zwischen Meituan und dem Benutzer werden stillschweigend umgangen. Meituan liefert natürlich immer noch Lebensmittel, aber was geliefert wird, liegt nicht mehr in der Hand des Meituan-Algorithmus.

Kurz gesagt: Bei einem AI-Mobiltelefon wird entschieden, was empfohlen wird und was nicht, nicht von den Algorithmen von Taobao, Meituan, Douyin und anderen Großkonzernen, sondern von der KI auf Ihrem Mobiltelefon.

Das ist ziemlich schlimm, Leute. Denn auf diese Weise werden die von den Plattformen über Jahre hinweg gesammelten Benutzerdaten plötzlich zur Nahrung für die KI, und der Ort, an dem der Benutzer Entscheidungen trifft, springt von der Produktseite auf die AI-Oberfläche. Die Plattformen werden also direkt umgangen.

Also, fragen Sie sich mal, würden Sie noch Geld in diese großen Plattformen investieren, um für die „Auktionsplatzierung“ zu bezahlen? Früher haben Sie es getan, weil diese Plattformen entschieden haben, wer auf der Startseite für die Verbraucher empfohlen wird. Deshalb waren Sie bereit, Geld für die Werbung auszugeben und an der Auktionsplatzierung teilzunehmen, um auf die Startseite zu kommen.

Aber bei einem AI-Mobiltelefon entscheidet die KI auf dem Mobiltelefon, was empfohlen wird, nicht Ihre Plattform. Warum sollte ich dann nicht das Geld an den Hersteller des AI-Mobiltelefons geben, damit die KI für mich „im Ohr flüstert“?

Das würde die wichtige Traffic-Einnahme der traditionellen Internetplattformen untergraben, und natürlich werden die Plattformen sich dagegen wehren.

Deshalb war der Boykott des Doubao-Mobiltelefons die einzige vernünftige Wahl der Plattformen, denn es handelt sich um eine Strategie, die die Plattformen am Wurzeln angreift. Es war in jeder Hinsicht notwendig, diese Strategie zu stoppen.

Das Problem wird nicht gelöst, sondern umgangen

Da die App-Hersteller solche Bedenken haben, wie wird diese Wand schließlich behandelt?

Der alte Experte meint: Dieses Problem wird nicht gelöst, sondern umgangen.

Die erste Möglichkeit ist eher ein Durchbrechen der Wand als ein Umgehen – die Regulierungsbehörden zwingen die Plattformen, die Interoperabilität zu öffnen.

Die EU hat bereits mit der DMA Apple, Google und andere dazu gezwungen, die Interoperabilität zu öffnen. In China wird auch ständig an der Interkonnektivität der Plattformen gearbeitet. 2021 hat die zuständige Behörde WeChat und Taobao aufgefordert, externe Links zu öffnen, was ein Signal ist. In der heutigen KI-Zeit wird die Offenlegung von Daten natürlich zu einer höheren Effizienz führen und stärkere Produkte hervorbringen, was ganz natürlich ist.

Aber offensichtlich wird diese Lösung das Interesse der großen Internetplattformen zu stark vernachlässigen.

Man muss bedenken, dass die Datenmauern der Plattformen nicht nur Monopolinstrumente sind, sondern auch die Rückzahlung für die langjährige Investition der Großkonzerne. Die sozialen Beziehungsnetzwerke, die WeChat über mehr als zehn Jahre hinweg aufgebaut hat, und die Transaktionsdaten, die von unzähligen Händlern und Verbrauchern auf Taobao gesammelt wurden, sind wertvolle Unternehmensassets. Sie repräsentieren reale Forschungs- und Entwicklungsinvestitionen, Betriebskosten und Risikotragung, und dahinter steckt die Arbeit von Tausenden von Technikern, die die Beschäftigung und das Leben von Hunderten von Tausenden von Menschen beeinflussen.

Wenn man die Plattformen zwanghaft dazu zwingt, die Daten zu öffnen, wird man in der Rechtssprechung der Frage „warum“ ausgesetzt sein, und im Geschäftsbetrieb würde dies bedeuten, dass solche Investitionen keinen Wert haben. Ein noch realistischeres Problem ist, dass die Behörden zwar die Öffnung von externen Links verlangen können, aber es schwierig ist, die Grenzen des „KI-Datenzugriffsrechts“ genau zu definieren. Die Plattformen können einfach eine formell kompatible,