Kann Doubao es schaffen, dass KI Mobiltelefone übernimmt?
Die Internetriesen rücken in den Markt für AI-Endgeräte schneller und aggressiver als erwartet vor.
Nachdem Alibaba die Quark-AI-Brille vorgestellt hat, hat ByteDance kürzlich die "Technische Vorschauversion des Doubao-Handy-Assistenten" veröffentlicht. Die ersten Prototypen wurden in Zusammenarbeit mit ZTE Corporation angefertigt, das Modell ist das Nubia M153, das für 3.499 Yuan verkauft wird. Derzeit ist es auf der offiziellen Website ausverkauft.
Nach der Bekanntgabe der Nachricht stieg die A-Aktie von ZTE Corporation (000063.SZ) vorübergehend um die Höchstzulässige Grenze, und die H-Aktie stieg um über 10 %. Da die Verkaufszahlen der Prototypen relativ gering waren, wurden die Geräte auf Zweitmarktplattformen um 700 bis 1.500 Yuan teurer angeboten.
Heutzutage, wo fast alle Smartphones "AI" als Verkaufsargument nutzen, verwenden die Hersteller im Allgemeinen den Technologieansatz, eine große Sprachmodell-API einzubinden und eigenständige Endgerätemodelle zu entwickeln, um Anwendungen im Bereich AIGC wie AI-Fotobearbeitung und -Schreiben anzubieten.
Radikale Hersteller wie Honor nutzen die "Barrierefreiemodus" des Android-Systems, um Klicks zu simulieren und den AI-Assistenten einige Applikationen für den Benutzer zu steuern, wie z. B. Kaffee zu bestellen.
Im Gegensatz zu den oben genannten Entwicklungspfaden hat ByteDance eine tiefe Zusammenarbeit mit ZTE eingegangen und das Doubao-Großmodell und den Agenten in das Betriebssystem integriert, um in einigen Szenarien das Smartphone "zu übernehmen" und automatisierte Vorgänge zu ermöglichen. Dieses Modell der engen Bindung zwischen einem führenden Großmodell und Smartphone-Hardware ist auf dem Markt bisher einmalig und hat die Aufmerksamkeit der Branche und der Verbraucher stark erregt.
AI übernimmt das Smartphone tiefgreifend
Der Sprachassistent für Smartphones entstand in den Anfängen der Smartphoneentwicklung. Der bekannteste ist Apples Siri, der 2011 als neues Feature des iPhone 4s eingeführt wurde. Da die AI-Technologie damals noch nicht so weit entwickelt war, waren die Funktionen des Sprachassistenten begrenzt und konnten nur einfache Aufgaben wie das Abfragen des Wetters, das Setzen von Weckern oder das Öffnen von Apps ausführen, ohne das Nutzungserlebnis des Smartphones grundlegend zu verändern.
Mit der Entstehung von GPT im Jahr 2022 hat sich die AIGC-Technologie allmählich verbreitet. Unterstützt von multimodalen Großmodellen hat sich der Smartphone-Assistent allmählich von der "App"-Form zur "Agent"-Form gewandelt. Einfach ausgedrückt, kann er nun das Smartphone für den Benutzer bedienen und komplexe Befehle ausführen. Der Doubao-Smartphone-Assistent ist ein Produkt dieser Logik.
Im Video hat der Mitarbeiter gezeigt, wie man den Doubao-Smartphone-Assistenten nutzen kann, um das Smartphone "zu übernehmen". Beispielsweise kann er die gesamte Kaufprozess von der Preissuche bis zur Bestellung und Bezahlung übernehmen. Mit Ausnahme sensibler Schritte wie der Bezahlung können alle anderen Vorgänge über den GUI-Agenten (Klicksimulation) ausgeführt werden.
Im fortschrittlicheren "Smartphone-Betrieb Pro-Modus" kann der Doubao nicht nur Klicks simulieren, sondern auch verschiedene Tools nutzen. Gleichzeitig unterstützt er das Gedächtnis von Kontextinformationen, was die Häufigkeit der Abfragen an den Benutzer verringert und die Flüssigkeit der Vorgänge erheblich verbessert.
Der Mitarbeiter hat eine sehr komplexe Aufgabe demonstriert: Im nächsten Monat nach Paris reisen, die in den Sozialen Medien gespeicherten Restaurants in Paris auf der Karte markieren, herausfinden, welche Museen am Tag nach der Ankunft Ausstellungen haben, ein Ticket für 10 Uhr morgens auf einer Reiseplattform buchen und die relevanten Informationen in die Notizen aufnehmen.
Während der Bearbeitung dieser Aufgabe hat der Doubao-Smartphone-Assistent mehrere Apps wie Xiaohongshu, WeChat, Dianping und Karten-Apps geöffnet, die relevanten Daten abgerufen und die Kartennachweise erfolgreich abgeschlossen. Anschließend hat er mit Hilfe des Tools "PersonalContext_Search" (Persönliche Kontextsuche) herausgefunden, welche Art von Museen der Benutzer bevorzugt, die Ausstellungsdaten recherchiert und die Buchung auf der Reiseplattform abgeschlossen. Insgesamt hat es 8 Minuten und 4 Sekunden gedauert. Nur bei der Bestätigung wichtiger Informationen und Bezahlungsinformationen musste der Benutzer eingreifen, alle anderen Schritte waren automatisiert und sehr bequem.
Außerdem haben einige Benutzer, die das Smartphone erworben haben, ihre Nutzungserfahrungen in den Sozialen Medien geteilt, darunter eigenständige Fotoaufnahme und -bearbeitung, Bestellung von Lieferessen und Preissuche beim Einkaufen. Der Doubao-Smartphone-Assistent konnte diese Aufgaben relativ reibungslos erledigen. Da sich das Produkt noch in der Testphase befindet, kann es bei einigen Aufgaben zu längeren Bearbeitungszeiten und häufigerem Eingreifen des Benutzers kommen, was jedoch mit zukünftigen Softwareupdates verbessert werden soll.
Doubao hat angekündigt, dass es von der Veröffentlichung bis zum ersten Quartal 2026 etwa alle zwei Wochen (außer an Feiertagen) ein Update veröffentlichen wird.
Drei Tage nach der Veröffentlichung: "Anmeldeprobleme" bei WeChat
Im Gegensatz zu traditionellen Sprachassistenten muss der AI-Assistent eine große Menge an Daten des Benutzers und von Drittanbieter-Apps auslesen und nutzen, um die Kontextinformationen besser zu verstehen. Daher sind die Datensicherheit und die Einhaltung gesetzlicher Vorschriften von entscheidender Bedeutung und können leicht zu Kontroversen führen.
Am 3. Dezember, also drei Tage nach der Veröffentlichung des Doubao-Smartphone-Assistenten, wurden einige Benutzer von WeChat ausgeloggt. Laut einer Meldung der "First Financial Daily" erhielt der Benutzer die Meldung: "Ihre Anmeldung bei WeChat ist in einem ungewöhnlichen Zustand. Aus Sicherheitsgründen melden Sie sich bitte von einem anderen Gerät aus an." Es wurde berichtet, dass der Benutzer auch nach dem Wechsel des WeChat-Kontos erneut automatisch ausgeloggt wurde.
Wenn ein Benutzer versucht, WeChat über den Doubao-Smartphone-Assistenten zu bedienen, wird die Meldung "Die Smartphone-Steuerung durch Doubao ist ein Laborfunktion und wird derzeit für WeChat nicht unterstützt" angezeigt.
Ein Vertreter von WeChat hat darauf geantwortet: "Es gab keine besonderen Maßnahmen. Es ist möglich, dass die bestehenden Sicherheitskontrollen ausgelöst wurden." Gemäß der "Softwarelizenz- und Nutzungsvereinbarung von Tencent WeChat" ist es verboten, "über nicht von Tencent entwickelte, autorisierte Drittanbieter-Software, -Plugins, -Extras oder -Systeme sich anzumelden oder die Software und den Dienst zu nutzen, automatisierte Vorgänge durchzuführen oder solche Tools und Methoden zu erstellen, zu veröffentlichen oder zu verbreiten". Tencent hat das Recht, die Funktionen des Kontos einzuschränken oder das Konto zu sperren, wenn diese Regelungen verletzt werden.
Nachdem das Problem bekannt geworden war, hat der Doubao-Smartphone-Assistent am Abend des 3. Dezember eine Mitteilung veröffentlicht, in der er angekündigte, dass die gesperrten WeChat-Konten nacheinander entsperrt werden. Gleichzeitig betonte er, dass der Doubao-Smartphone-Assistent keine Hackerangriffe ausführt, dass er die Erlaubnis des Benutzers benötigt, um die INJECT_EVENTS-Berechtigung (Android-Systemebene) zu erhalten, und dass in der Cloud keine Bildschirminhalte des Benutzers gespeichert werden und diese auch nicht in den Modelltrainingsprozess einfließen.
Li Liang, Vizepräsident der TikTok-Gruppe, hat auf Weibo erklärt: "Ich denke, dass es keine Verletzung der Privatsphäre gibt, wenn der Benutzer seine Zustimmung erteilt. Der Doubao-Smartphone-Assistent kann nur mit der Zustimmung des Benutzers das Smartphone bedienen, und alle Berechtigungen werden in der Privatsphäre- und Sicherheits-Weißbuch auf der offiziellen Website klar dargelegt. Es gibt keine derartigen Vorfälle wie 'Eindringlinge' oder 'Überschreitung von Rechten', wie in einigen Gerüchten behauptet wird."
Ob der Doubao-Smartphone-Assistent bei der Auslesung und Verarbeitung der Daten von Drittanbieter-Apps die Genehmigung der jeweiligen App-Betreiber benötigt und welche Regeln und Prinzipien bei der Datensammlung und -nutzung gelten, hat ZTE Corporation bis zum Zeitpunkt der Veröffentlichung dieser Meldung auf die Anfrage von "Wall Street Tech Eye" nicht beantwortet.
Im "Doubao-Smartphone-Assistenten-Weißbuch", das auf der offiziellen Website von Doubao veröffentlicht wurde, werden in vier Kapiteln die Informationssicherheitsfähigkeiten und Technologiemaßnahmen des Doubao-Smartphone-Assistenten beschrieben. Es wird zugesichert, dass die Daten in der Cloud und auf dem Endgerät begrenzt gesammelt und vernünftig genutzt werden und dass sensible Daten durch Sicherheitsverschlüsselung, Entsensitivierung und Isolierung geschützt werden. Es wird jedoch nicht klar angegeben, welche spezifischen Genehmigungen von Drittanbieter-Apps erlangt wurden.
Dieser kleine Zwischenfall hat die Schwierigkeiten aufgezeigt, denen AI-Assistenten bei der Nutzung von Drittanbieter-Apps gegenüberstehen. Branchenmitglieder haben darauf hingewiesen, dass obwohl Gesetze wie die "Verordnung über die Verwaltung der Netzwerkdatensicherheit" entsprechende Vorschriften für automatisierte Tools und AIGC-generierte Daten getroffen haben, die Verantwortung in den verschiedenen Schritten der Datenflüsse von AI-Smartphones (Assistenten) aufgrund der Vielzahl an Beteiligten noch nicht klar definiert werden kann. Aus der Sicht der Drittanbieter-App-Hersteller bedeutet die Zustimmung des Benutzers nicht automatisch, dass der AI-Smartphone-Assistent die App verwalten oder die Daten nutzen kann, da dies möglicherweise auf Geschäftsgeheimnisse zugreift.
Positiv ist, dass die Branche sich aktiv für die Einrichtung entsprechender Standards einsetzt. Am 2. Dezember hat das Cloud Computing Standards and Open Source Promotion Committee in Zusammenarbeit mit dem China Academy of Information and Communications Technology die "Richtlinie für die doppelte Autorisierung und Sicherheit bei der Interaktion zwischen Endgeräten und Cloud-Intelligent Agenten" veröffentlicht, in der es eindeutig festgelegt ist, dass ein Intelligent Agent sowohl die Genehmigung der App als auch die des Benutzers benötigt, um legal auf Drittanbieter-Apps zugreifen zu können.
Der Türöffner für Internetriesen, die neue Chance für Smartphonehersteller
Obwohl sich der Doubao-Smartphone-Assistent noch in der technischen Vorschauphase befindet, hat er bereits eine enorme Aufmerksamkeit erregt und gleichzeitig die Bekanntheit von ZTE-Smartphones erhöht, was für beide Seiten ein Gewinnsituation ist. Die Zusammenarbeit wurde sicherlich von den Marktausweitungszielen von ByteDance und den Smartphoneherstellern getrieben.
Für ByteDance war die Hardware ein fehlendes Bauteil in seiner strategischen Plattform. In den letzten Jahren hat ByteDance durch die Akquisition von Unternehmen wie Pico, Smartisan und Oladance die Fähigkeit zur Hardwareentwicklung von Smartphones, Kopfhörern und VR-Brillen erworben, hat aber noch nicht das Produktkonzept von "Kern-App + eigenentwickelte Hardware" realisiert. Nachdem die monatliche aktive Benutzerzahl von Doubao über 150 Millionen erreicht hat, scheint die AI-native App ein Durchbruchspunkt zu sein.
Zurzeit hat Doubao angekündigt, dass es kein eigenes Smartphone entwickeln wird und mit mehreren Herstellern über die Zusammenarbeit an einem Doubao-Smartphone-Assistenten spricht. Ein anderes Doubao-Hardwareprodukt, das Ola Friend-Kopfhörer, ist jedoch eigenentwickelt und stammt von der akquirierten Marke Oladance. Dies zeigt, dass ByteDance immer noch an der AI-Hardwaremarkt interessiert ist, aber einen eher vorsichtigen Ansatz verfolgt.
Tatsächlich haben in den Anfängen der Smartphoneentwicklung Internetriesen wie Facebook, Alibaba und Tencent versucht, ein eigenes Betriebssystem (oder UI) zu entwickeln und in Zusammenarbeit mit Smartphoneherstellern Hardwareprodukte zu bringen. Aufgrund fehlender Wettbewerbsfähigkeit konnten sie jedoch nicht in den Mainstream-Markt eindringen, wie z. B. die Alibaba Cloud-Smartphones und die HiQQ-Smartphones.
Das Interesse der Internetriesen an Hardware stammt aus der Logik der "Kombination von Hardware und Software". Der verstorbene Gründer von Apple, Steve Jobs, hat einmal gesagt: "Apple ist ein Softwareunternehmen", und seine Kernkompetenz liegt in der Kombination von eigenentwickeltem Betriebssystem und Hardware. Mac und iPhone sind Produkte dieser Logik und haben Apple großen Erfolg gebracht.
Wenn man sagt, dass das Betriebssystem der Herrscher der alten Zeit war, dann ist AI die Hoffnung der neuen Zeit. Wu Yongming, CEO von Alibaba, hat in einem Vortrag prophezeit: Große Sprachmodelle werden das Betriebssystem der nächsten Generation sein, und AI Cloud wird der Computer der nächsten Generation sein. Dies erklärt, warum die Internetriesen in den AI-Hardwaremarkt einsteigen, sei es durch eigene Entwicklung oder Zusammenarbeit.
Darüber hinaus hat AI in einem stagnierten Smartphonemarkt eine neue Wachstumsmöglichkeit geschaffen und die Aufmerksamkeit der Smartphonehersteller erregt. Das Training von großen Sprachmodellen erfordert hohe Investitionen, und nicht alle Unternehmen können dies leisten. Für Hersteller wie ZTE, die nicht zu den führenden Marken gehören, ist die Zusammenarbeit mit einem führenden Großmodell sicherlich die kostengünstigste Option.
Ob das "Doubao-Modell" auf dem Markt zum Mainstream wird, bleibt abzuwarten. Einerseits sind die großen Smartphonehersteller wie Apple und Huawei bei der Zusammenarbeit mit Großmodell-Anbietern eher vorsichtig und werden in ihrem eigenen Betriebssystem kaum die Kernrechte an Drittanbieter-Großmodelle abgeben.
Andererseits sind die chinesischen Smartphonehersteller im Android-Kampfkreis eher offen. Laut aktuellen Informationen haben Hersteller wie OPPO, vivo und Honor keine Pläne, den Doubao-Smartphone-Assistenten zu integrieren, aber eine zukünftige Zusammenarbeit ist nicht ausgeschlossen. Laut einer Medienbericht hat ein Mitarbeiter eines Smartphoneherstellers gesagt, dass Doubao im nächsten Monat ein technisches Konzept veröffentlichen werde. Das Unternehmen beobachtet die Entwicklung und hat derzeit keine Pläne für eine Zusammenarbeit, lehnt es aber nicht ab. "Es hängt davon ab, wie gut das Konzept von Doubao mit unseren eigenen AI-Funktionen übereinstimmt", betonte der Mitarbeiter.
Dieser Artikel stammt aus dem WeChat-Account "Wall Street Tech Eye", geschrieben von Leon und redigiert von cc Sun Congying, und wurde von 36