Handyhersteller nähern sich Doubao.
Nicht alle 30.000 Exemplare des Nubia M153 sind bisher verkauft. Das Partnerschaftsnetzwerk von Doubao auf der Mobiltelefonseite hat noch Potenzial zur weiteren Expansion.
Kürzlich berichtete Jiemian News, dass ByteDance die Zusammenarbeit mit Hardwareherstellern wie vivo, Lenovo und Transsion im Bereich der AI-Mobiltelefone vorantreibt und deren Geräte mit AIGC-Plug-Ins vorinstalliert. Mehrere Mitarbeiter von vivo bestätigten Medien, dass die Zusammenarbeit festgelegt sei und die Details noch diskutiert würden.
Aber anhand der vagen Formulierung dieser Nachricht lässt sich noch nicht feststellen, welche Art von Zusammenarbeit es genau ist und ob sie mit dem früheren Kooperationsplan zwischen ByteDance und ZTE übereinstimmt. Früher hat ByteDance auf dem Nubia M153 auf der Betriebssystemebene des Mobiltelefons eine GUI-Agent tiefgehend implementiert, die bestimmte über App-Grenzen hinweggehende Benutzeraktionen automatisch übernehmen kann. Doch daraufhin wurden Gegenmaßnahmen von Apps wie WeChat und Taobao ergriffen.
Aber aus den neuesten Gerüchten über die Zusammenarbeit ist ersichtlich, dass der Versuch mit dem M153 die Aufmerksamkeit der Mobiltelefonbranche auf sich gezogen hat. Mit dem Eintritt von ByteDance mit der Doubao-Großmodelltechnologie in den Markt beschleunigt sich die Expansion der nativen AI-Ekosysteme von Endgeräteherstellern.
Diesen Trend lässt sich an der kürzlich stattgefundenen FORCE-Konferenz von Volcengine ablesen.
Mehrere Mobiltelefonhersteller wie ZTE, Honor, Xiaomi und vivo stellten sich hinter Volcengine. Abgesehen vom Nubia M153 nutzen die meisten Mobiltelefonhersteller hauptsächlich die Modellfähigkeiten von Doubao. Die Produktform, die Interaktionsweise und die systemweite Integration auf der Agent-Ebene werden immer noch hauptsächlich von den Mobiltelefonherstellern geleitet.
Während der Gruppeninterview-Session auf der FORCE-Konferenz sagte Tan Dai, der Präsident von Volcengine, in einem Interview mit Zhimian AI: „Der Wert von AI liegt darin, die Bedürfnisse der Benutzer auf bequemere und effizientere Weise zu befriedigen.“
Offensichtlich wird unabhängig davon, wie die Zusammenarbeit zwischen ByteDance und diesen Herstellern weitergeht, ein Branchentrend immer deutlicher. Das Potenzial von System-Agents ist enorm. Auch wenn es derzeit Hindernisse bei der Umsetzung gibt, lässt sich auf dem M153 bereits die Vorstellung von der Zukunft gewinnen.
Ob es um Zusammenarbeit oder Eigenentwicklung geht, Großmodellhersteller und Mobiltelefonhersteller rufen den Ruf „Größer und stärker werden“ und drängen sich beschleunigt in diesen Marktbereich.
1
Der Grund, warum Mobiltelefonhersteller sich beschleunigt an Großmodellhersteller wie ByteDance annähern, liegt darin, dass es auf der Mobiltelefonseite im Bereich der nativen Assistenten eine natürlich riesige Basis an aktiven Benutzern gibt.
Der Bericht von QuestMobile für das dritte Quartal 2025 zeigt, dass bis September 2025 die monatliche aktive Benutzerzahl (MAU) von mobilen AI-Anwendungen 729 Millionen erreicht hat. Darunter beträgt die Anzahl der Benutzer von „AI-Assistenten der Mobiltelefonhersteller“ etwa 535 Millionen, die von „nativen AI-Apps“ etwa 287 Millionen und die von „In-App-AI“ etwa 706 Millionen.
Mit anderen Worten, in den verschiedenen Formen der nativen AI gibt es einen deutlichen Unterschied in der Benutzerzahl zwischen Endgeräten und Apps: Native AI-Apps erfordern die aktive Interaktion der Benutzer, während systemweite Assistenten von Natur aus in einer Position sind, die es Benutzern ermöglicht, sie bequem zu nutzen, ohne dass diese extra klicken müssen, um ihren täglichen Aktivitätsgrad aufrechtzuerhalten.
Tatsächlich ist die Erforschung darüber, wie man AI auf der Systemebene aufruft und wie man den Assistenten nicht nur auf Sprachfragen und -antworten beschränkt, fast das Gemeinsame aller führenden chinesischen Mobiltelefonhersteller geworden. Doch aufgrund der begrenzten Modellfähigkeiten und der mangelnden Stabilität der Engineering-Lösungen bleiben die meisten Lösungen auf der Stufe des „verbesserten Sprachassistenten“. Die Entstehung des Doubao-Mobiltelefonassistenten hat diese Tür endgültig geöffnet.
Obwohl die Leistung des Nubia M153 in der Branche noch umstritten ist, hat der Doubao-Mobiltelefonassistent nach der Erteilung der Berechtigung auf der OS-Ebene die Möglichkeit, über App-Grenzen hinweggehende Benutzeraufgaben automatisch zu übernehmen, was der Branche die Vorstellung von einem voll ausgebildeten GUI-Agent vermittelt hat. Der damit verbundene Vorstellungsraum verschwindet nicht, auch wenn einige Super-Apps Gegenmaßnahmen ergreifen.
Andererseits haben Großmodelle in den letzten zwei Jahren deutliche Fortschritte bei der Verständnis von Anweisungen, der mehrstufigen Planung und der Nutzung von Tools gemacht. AI ist erstmals in der Lage, komplexe Aufgabenketten zu bewältigen. Gleichzeitig hat die kontinuierliche Verbesserung der Rechenleistung, des Arbeitsspeichers und der lokalen Inferenzfähigkeit auf der Mobilseite auch dazu geführt, dass die „Ausführung auf der Geräteseite“ nicht mehr nur ein Konzept ist.
Einer der Schlüsselpunkte, um AI auf Mobiltelefonen laufen zu lassen, ist der sprunghafte Anstieg der Spitzenrechenleistung und der Energieeffizienz der NPU im Mobil-SoC in den letzten beiden Generationen. Laut einer Analyse der Branchenforschungsstelle Counterpoint unterstützen fast alle globalen führenden SoCs für Flaggschiffmodelle 2025 generative AI. Etwa 88 % der in diesem Jahr ausgegebenen High-End-SoCs verfügen bereits über generative AI-Fähigkeiten, und die Spitzenrechenleistung dieser Chips für AI hat 2025 fast das Niveau von 100 TOPS erreicht, etwa viermal so hoch wie 2021.
Im Zuge der Einwanderung von AI in Mobiltelefone reicht die Logik der Sprachassistenten aus der Siri-Zeit, die hauptsächlich auf festen Anweisungen basiert, nicht mehr aus, um die Erwartungen der Benutzer an „Intelligenz“ zu erfüllen.
In diesem Zeitfenster suchen Mobiltelefonhersteller dringend nach neuen Erlebnisbrechern auf der Hardware- und Systemebene, während AI-Cloud-Hersteller über reifere Modelle und Engineering-Fähigkeiten verfügen. Die Annäherung beider Seiten ist keine zufällige geschäftliche Erkundung, sondern das Ergebnis der Reife der Technologie und des Bedarfs der Branche.
Deshalb, obwohl die Verkaufszahlen des M153 begrenzt sind, wirken die 30.000 Prototypen wie eine Signalrakete und geben der Mobiltelefonbranche, die schon lange aufgeregt ist, ein Signal zum Angriff.
Vor diesem Hintergrund ist es vernünftig, dass es Nachrichten gibt, dass größere Hersteller wie vivo mit ByteDance an der Zusammenarbeit arbeiten. Dies bedeutet nicht, dass alle Hersteller das tiefgehende Anpassungsmuster des M153 kopieren werden. Vivo hat zuvor die AI-Strategie „BlueHeart Intelligence“ und eine eigene Matrix von BlueHeart-Großmodellen veröffentlicht und betont, dass das OriginOS und die Fähigkeiten des systemweiten Agenten verbessert werden.
Andererseits hat das YOYO Agent von Honor beispielsweise einige Fähigkeiten des Doubao-Großmodells integriert, aber die Schulung des Agenten, die Produktlogik und die Systemintegration werden immer noch von Honor geleitet. Diese Art der „Integrierung von Fähigkeiten statt des Outsourcings des Produkts“ ist möglicherweise die realistische Wahl für mehr Mobiltelefonhersteller in der gegenwärtigen Phase.
Es ist bemerkenswert, dass Luo Wei, der leitende Bildingenieur von Honor, zuvor seine persönliche Meinung über den Doubao-Mobiltelefonassistenten geäußert hat: „Da ByteDance keine Fähigkeiten in der Hardwareentwicklung hat oder die Hardwarefähigkeiten nicht besser sind als die von ZTE. Dann ist es wie, wenn zwei Kurze zusammenkommen, und es wird kein Langes geben.“
Aber nach dieser Bewertung war der Stand von Honor dennoch als Partner von Volcengine auf der FORCE-Konferenz vertreten.
Rückblickend gesehen war diese aggressive Vorgehensweise von ByteDance keine übermäßige Eile, sondern ein Schritt in einem sich langsam entwickelnden Zeitfenster. Die Bedeutung des M153 liegt nicht darin, den Erfolg eines bestimmten Produkts zu beweisen, sondern darin, dass die Branche sich sicherer ist, dass der Geräte-Agent ein Weg ist, den man nicht umgehen kann.
Angesichts der immer höheren Barrieren, die Apps wie WeChat und Taobao errichten, wird die Beziehung zwischen Apps und Agenten die nächste Frage, der man sich stellen muss.
2
Seit der Einführung des Doubao-Mobiltelefonassistenten hat es in der Branche einige Diskussionen ausgelöst: Ist der Agent eine Bedrohung für traditionelle Apps, wenn AI in der Lage ist, Absichten direkt zu verstehen und Aktionen im Namen des Benutzers auszuführen?
Während der Gruppeninterview-Session auf der FORCE-Konferenz von Volcengine beantwortete Tan Dai diese Frage, die ihm von Zhimian AI gestellt wurde. Er begann seine Erklärung von der Perspektive der Benutzer.
„Nehmen wir an, ein Benutzer möchte eine Tasse Kaffee bestellen. Egal, ob er dies durch eine Sprachinteraktion mit einem Roboter oder durch die Bedienung seines Mobiltelefons tut, das Ziel ist es, die Bedürfnisse des Benutzers zu befriedigen.“ Aus seiner Sicht gibt es noch viele Bedürfnisse der Menschen, die nicht befriedigt sind, und AI kann helfen, diese Probleme besser zu lösen.
„Es spielt vielleicht keine so große Rolle, ob das Trägergerät von AI ein Webportal, eine App, ein Agent oder ein Agent in einer App-Umhüllung ist.“ So sagte Tan Dai.
Wenn man also auf die Ebene des nativen Mobiltelefonassistenten zurückkommt, ist die Anzahl der Apps, die er bedienen kann, möglicherweise nie das Kernproblem. Das Wichtigste ist, ob AI die bisher unbefriedigten Bedürfnisse der Benutzer mit geringeren Kosten lösen kann. Wenn die Bedürfnisse „vergrößert“ werden, kann man auf der Hardwareebene ein neues Benutzerbewusstsein schaffen, insbesondere in einem Jahr wie 2025, in dem die meisten Benutzer mit AI bereits vertraut sind.
Die Daten von QuestMobile zeigen, dass bis zum ersten Quartal 2025 die monatliche Anzahl der aktiven Benutzer von nativen AI-Apps stark zugenommen hat. Dabei hat sich die Einstellung der Benutzer gegenüber nativen AI-Apps von der anfänglichen Neugierde hin zu einer Abhängigkeit entwickelt. Die durchschnittliche monatliche Anzahl der App-Nutzungen pro Benutzer hat einen deutlich höheren Zuwachs als die durchschnittliche monatliche Nutzungsdauer pro Benutzer.
Der Bericht zeigt, dass die durchschnittliche monatliche Anzahl der Nutzungen von nativen AI-Apps um etwa 53,1 % im Vergleich zum Vorjahr zugenommen hat, während die durchschnittliche monatliche Nutzungsdauer nur um etwa 32,7 % gestiegen ist. Die Benutzer neigen dazu, AI-Apps häufiger, aber für kürzere Zeit zu öffnen, um sofortige Bedürfnisse zu befriedigen.
Diese Bedürfnisse sind genau diejenigen, die der native Mobiltelefon-Agent vergrößern kann. Dies ist im Wesentlichen ein Logik des Wachstums und bedeutet nicht, dass der Wert der Apps in kurzer Zeit schnell abnehmen wird.
Der Bericht über die digitale Anwendungsökosysteme, der 2024 von der China Academy of Information and Communications Technology veröffentlicht wurde, zeigt, dass die Nutzungszeit der Benutzer immer noch stark auf wenige führende Apps konzentriert ist. Kernanwendungen wie Zahlungen, Sofortnachrichten und Kurzvideos machen zusammen mehr als 80 % der gesamten Nutzungszeit der Benutzer aus. Die Account-Systeme, Zahlungsfähigkeiten, Inhaltslieferung und Sicherheitsverantwortung, die diese Apps tragen, können in kurzer Zeit nicht direkt durch Agenten ersetzt werden.
Das bedeutet, dass der Agent die „Eingangsposition“ der Apps verändert, statt deren Existenzwert zu beseitigen.
In dieser Struktur bleiben die Apps weiterhin die Verkörperung von Fähigkeiten und Dienstleistungen, aber sie sind nicht unbedingt der Ausgangspunkt für die Benutzer, um ihre Bedürfnisse auszudrücken. Der Agent übernimmt zunehmend die Rolle der „Bedürfnisverwaltungsebene“ und ist dafür verantwortlich, die Absichten der Benutzer zu verstehen, die Aufgaben zu zerlegen und die Ausführung an verschiedene Anwendungen oder Systemfunktionen zu verteilen.
Selbst das Endgerät, mit dem der Benutzer den Agenten steuert, muss nicht unbedingt ein Mobiltelefon sein.
Den Daten von Counterpoint Research zufolge hat der Markt für intelligente tragbare Geräte 2025 ein deutliches Wachstum bei Endgeräten wie intelligenten AR-Brillen mit lokalen AI-Fähigkeiten gezeigt. Im ersten Halbjahr 2025 ist die Weltweitauslieferung von intelligenten AR-Brillen um mehr als 110 % gegenüber dem Vorjahr gestiegen. Der Anteil der AI-typischen intelligenten AR-Brillen an der Gesamtauslieferung hat stark zugenommen, was auf eine schnelle Akzeptanz der lokalen AI-Fähigkeiten in der Branche hinweist.
Vor diesem Hintergrund wird ByteDance nicht der einzige Großmodellhersteller sein, der in diesen Markt eintritt.
Zhipu AI hat kürzlich sein Kern-AI-Agent-Modell AutoGLM Open Source gemacht, sodass Forscher und Entwickler auf der Grundlage dieses Modells intelligente Endgeräte-Agenten mit der Fähigkeit „Phone Use“ entwickeln können.
AutoGLM kann den Bildschirminhalt verstehen und durch die Simulation von Benutzeraktionen (z. B. Klicken, Scrollen, Texteingabe usw.) mehrstufige Aufgabenabläufe ausführen. Derzeit hat es in mehr als 50 häufigen chinesischen Anwendungsfällen wie WeChat, Taobao, Douyin und Meituan die Fähigkeit zur automatischen Bedienung gezeigt.
Mit anderen Worten, wenn mehr Großmodellhersteller versuchen, in Mobiltelefone einzudringen, ist der Unterschied nicht mehr nur die Integration des Modells, sondern ob die Mobiltelefonhersteller bereit sind, die AI-Eingänge und -Regeln auf der Systemebene herauszugeben. Der Wettbewerb in der nächsten Phase ähnelt eher einem Kampf um das „System und die Ökosysteme“.
3
Wenn man sagt, dass der Nubia M153 eher eine Art „Engineering-Validierung“ ist, dann repräsentiert die gleichzeitige Veröffentlichung der Fortschritte von Pengpai OS und AI auf der Xiaomi Smart Home and Mobility Ecosystem Conference einige Wochen nach seiner Einführung die Reaktion der traditionellen Mobiltelefonhersteller.
Bei dieser Konferenz legte Xiaomi nicht den Schwerpunkt auf ein einzelnes Modell oder eine einzelne Funktion, sondern betonte wiederholt die Rolle des Pengpai OS als systemweite Basis. Es wird zu einem einheitlichen Betriebssystemrahmen für die Verbindung von Mobiltelefonen, Tablets, Fernsehern und anderen Endgeräten und ist auch die zentrale Ebene, auf der die AI-Fähigkeiten organisiert, verteilt und eingeschränkt werden.
Diese Einschätzung basiert nicht nur auf Konzepten. Laut den offiziellen Daten von Xiaomi hatte das Xiaomi AIoT-Ökosystem bis Ende 2024 mehr als 820 Millionen angeschlossene Geräte, die Mobiltelefone, Tablets, Fernseher, tragbare Geräte und Haushaltsgeräte umfassen. Das Ziel des Pengpai OS ist es, diese verstreuten Geräte in einen einheitlichen Systemrahmen zu integrieren, sodass die AI-Fähigkeiten zwischen verschiedenen Endgeräten verteilt und wiederverwendet werden können, anstatt an eine einzelne App gebunden zu sein.
Dies bedeutet, dass Xiaomi die AI-Fähigkeiten fest in das Betriebssystem integriert hat und dass das damit verbundene Hardware-Ökosystem ebenfalls riesig ist.
Andererseits hat Luo Fuli,