Außer Smartphones, welche Chancen gibt es noch in der AI-Hardware-Branche? Lassen Sie uns mit dem Doubao-Smartphone beginnen.
Redaktionelle Anmerkung
In einem scheinbar starren Markt mit dem Prinzip des "Gewinner bekommt alles" können Herausforderer dennoch den Status quo brechen, wenn sie ausreichend strategische Geduld und systemische Fähigkeiten besitzen.
In letzter Zeit hat der Doubao Handy-Assistent eine dramatische Kontroverse ausgelöst. Diese AI-Anwendung, die behauptet, das Handy "übernehmen" zu können, wurde von den Nutzern aufgrund ihrer Fähigkeiten wie simuliertem Klicken und Bildschirmerkennung einst als "endlich der AI-Teamkollege, der mich versteht" angesehen. Sie traf präzise die Schmerzpunkte der Nutzer, die häufig zwischen verschiedenen Apps wechseln müssen, und zeichnete ein Bild einer Zukunft, in der intelligente Agenten hochgradig autonom sind. Doch nicht lange darauf gaben WeChat, Alipay und mehrere Bank-Apps nacheinander Risikowarnungen aus und setzten technische Sperren, was diese Euphorie schnell in die peinliche Situation eines "Ökosystem-Abschneidens" führte.
Die Spaltung in der öffentlichen Meinung war recht typisch. Die Befürworter verurteilten die Internetriesen dafür, ihre Monopolstellung auszunutzen, um Innovation zu ersticken. Sie sahen darin eine Unterdrückung neuer Technologien durch die alten Mächte. Die Gegner hingegen befürchteten Datensicherheit und Privatsphäre, da diese "systemweite Übernahme" unkontrollierbare Risiken mit sich bringe. Wenn wir jedoch diese binäre Opposition zwischen "Innovation und Monopol" überwinden und die Sache aus der Perspektive der Geschäftsentwicklung betrachten, wird deutlich, dass beide Seiten möglicherweise nicht den Kern der Frage getroffen haben.
Die Schwerpunkte dieser Debatte - das Recht auf Innovation und die Ökosystem-Sicherheit - sind zwar wichtig, doch beide vermeiden eine noch grundlegendere Frage: Welche Position nimmt Doubao in diesem digitalen Ökosystem tatsächlich ein? Warum hat sein technischer Ansatz eine so starke Gegenreaktion ausgelöst? Dieser Artikel versucht, diese Fragen von drei Dimensionen aus zu beantworten: der Ökosystemposition, der Verbindungsart und dem Umsetzungspfad. Gleichzeitig möchten wir auch fragen: Wo liegen die echten Chancen in der Goldenen Ära der Kombination von AI und Hardware?
Doubaos drei Dilemmata
Dilemma 1: Die grundlegende Fehlpassung der Ökosystemposition
Um Doubaos erstes Dilemma zu verstehen, müssen wir ein Schlüsselkonzept einführen: die Ökosystem-Zentralität. Vereinfacht ausgedrückt misst die Zentralität, wie stark ein Produkt die Kernressourcen der Nutzer kontrolliert - einschließlich Betriebssystemrechten, Account-Systemen, Datenhoheit und dem daraus resultierenden Machtanspruch im Ökosystem. Je höher die Zentralität, desto größer ist die Macht des Produkts im Ökosystem und desto weniger abhängig ist es von anderen. Das Handy ist geradezu das Epitom eines Produkts mit hoher Zentralität und ein Super-Schlachtfeld, das von den Konzernen streng bewacht wird.
Was ist nun die Ökosystemposition des Doubao Handy-Assistenten? Er ist weder ein Betriebssystem, das Ressourcen auf unterster Ebene steuern kann, noch eine Super-App, die über ein eigenes Account-System und Datenspeicherung verfügt. Er ist eine Drittanbieter-App, die versucht, die Bedienabläufe anderer Apps durch simuliertes Klicken und Bildschirmerkennung "zu übernehmen". Die Essenz dieser Ökosystemposition ist eine niedrige Zentralität - er hat keine nennenswerte Kontrolle über die Kernressourcen der Nutzer.
Diese Fehlpassung führt zu einem strukturell ungerechten Wettbewerb. Doubao versucht, mit einer Position niedriger Rechte die Kontrolle über ein Ökosystem mit hohen Rechten zu erlangen. Er möchte WeChat dazu bringen, Nachrichten zu senden, Alipay Transfers durchzuführen und Bank-Apps den Kontostand abfragen lassen, aber er hat weder die untersten Rechte dieser Konzern-Apps noch die Vertrauenswürdigkeit, die die Nutzer diesen Konzernen entgegenbringen. Es ist wie der Versuch, ein neues Koordinierungsmechanismus im bestehenden Ökosystem aufzubauen, ohne die Genehmigung und Unterstützung des Ökosystemführers - auch wenn er eine gewisse technische Methode hat, wird er auf jeden Fall auf Gegenmaßnahmen des Ökosystemführers stoßen, da diese Methode grundsätzlich das bestehende Rechtssystem herausfordert.
Ein tieferes Problem besteht darin, dass Doubaos Wertversprechen auf dem Abbau der bestehenden Ökosystemkontrolle basiert. Je erfolgreicher er wird, desto mehr bedroht er die Kerninteressen des Betriebssystems und der Super-Apps. Dies ist nicht der Kampf zwischen technischer Innovation und alten Mächten, sondern ein Versuch eines Tools mit niedriger Zentralität, die Regeln eines Ökosystems mit hoher Zentralität neu zu gestalten. In der kommerziellen Konkurrenz kann diese Fehlpassung oft fatal sein.
Dilemma 2: Die strukturelle Schwäche der Verbindungsart
Doubaos technischer Ansatz scheint geschickt, beruht aber auf einer äußerst schwachen Grundlage. Diese Schwäche zeigt sich auf technischer und auf Interessenebene und bildet zusammen das Schicksal einer parasitischen Verbindung.
Auf technischer Ebene ist Doubao auf simuliertes Klicken und Bildschirmerkennung angewiesen, um über Apps hinweg zu operieren. Das bedeutet, dass er jedes Element auf den App-Bildschirmen genau erkennen muss - wo die Buttons sind, wo die Eingabefelder sind, wo die Bestätigungstasten sind. Aber diese Bildschirme sind nicht statisch. Jede WeChat-Version kann das Layout des Chat-Bildschirms ändern, jede Alipay-Umschreibung kann den Transaktionsablauf völlig verändern, und die Sicherheitsupdates der Bank-Apps sind noch häufiger. Jede Bildschirmänderung lässt Doubaos sorgfältig erstellte Bedien-Skripte zusammenbrechen. Diese Abhängigkeit ist kein zufälliger technischer Fehler, sondern eine inhärente Eigenschaft des Parasitenmodells - das Überleben des Parasiten hängt von der Stabilität des Wirts ab, und der Wirt hat nicht nur keine Pflicht, sich für den Parasiten stabil zu halten, sondern hat sogar Anreize, ihn durch Veränderungen zu vertreiben.
Noch fataler ist der Konflikt auf Interessenebene. Dieser Konflikt besteht aus drei aufeinander aufbauenden Ebenen.
Die erste Ebene ist der Kampf um die Datenhoheit. Damit ein AI-Assistent wirklich intelligent werden kann, muss er das Verhaltensmuster der Nutzer tiefgehend verstehen - das bedeutet, dass er auf WeChats soziale Netzwerke, Alipays Konsumaufzeichnungen, Kalender-Events und Gesundheits-App-Daten zugreifen muss. Aber genau diese Daten sind die Grundlagen, auf denen die Super-Apps ihre Wettbewerbsvorteile aufbauen. WeChats soziale Netzwerke ermöglichen präzise Werbeplatzierungen und die Mini-Programm-Ekosystem, Alipays Konsumdaten sind die Kernbestände für seine Kreditbewertungen und Finanzdienstleistungen.
Die zweite Ebene ist das Nullsummenspiel der Geschäftslogik. Wenn Tencent und Alibaba einem Drittsystem Zugang zu diesen Kern-Daten-Schnittstellen gewähren würden, wäre das gleichbedeutend damit, dass sie ihre kommerziellen Barrieren absichtlich abbauen. Dies ist kein technisches Problem, sondern ein grundlegender Konflikt bei der Interessenverteilung. Jede Datenhoheit, die Doubao gewinnt, bedeutet einen Verlust für die Konzern-Apps. Wenn WeChat feststellt, dass Doubao die Chat-Nachrichten der Nutzer liest, oder wenn Alipay feststellt, dass Doubao die Konsumverhalten der Nutzer analysiert, werden ihre Risikomanagementsysteme die einzig rationale Reaktion zeigen - die Absperrung. Dies ist nicht konservativ, sondern ein Instinkt für kommerzielle Selbstverteidigung.
Die dritte Ebene ist die Abneigung der Nutzer. Selbst wenn die Konzern-Apps unter Druck aus der Regulierung eine gewisse Kompromisslösung finden würden, würden die Nutzer diese tiefe Bindung möglicherweise nicht akzeptieren. Wenn ein System die volle Infiltration Ihres digitalen Lebens benötigt, um Ihnen Nutzen zu bringen, ist es nicht mehr ein einfach austauschbares Tool, sondern wird zu einem Betreuer Ihrer digitalen Persona. Diese tiefe Abhängigkeit bringt nicht nur die Angst vor Datenschutzverletzungen mit sich, sondern auch eine instinktive Abneigung gegen den Verlust der Selbstbestimmung. Sobald alle Verhaltensspuren einem AI-System anvertraut werden, ändert sich die Beziehung zwischen Nutzer und System von "aktive Nutzung" zu "passive Abhängigkeit". Der Sprung über diese psychologische Schwelle ist viel schwieriger als die technische Umsetzung.
Eine parasitäre Verbindung kann keine stabile Geschäftsmodelle aufbauen. Der Wirt kann jederzeit durch technische Upgrades oder strategische Anpassungen den Lebensraum des Parasiten schließen. Doubaos Problem liegt nicht darin, dass seine Technologie nicht fortschrittlich genug ist, sondern dass er eine Verbindung gewählt hat, die grundsätzlich nicht nachhaltig ist. Im Gegensatz dazu würde eine symbiotische Verbindung, die auch dem Wirt Nutzen bringt, die Situation völlig ändern - dies ist genau die Kernlogik unseres dritten Modells.
Dilemma 3: Die fatale Schwäche des Umsetzungspfads
Die Erfindung des Autos bestand nicht darin, einem Pferd einen Motor zu montieren, sondern darin, die gesamte zugrunde liegende Logik des Verkehrsmittels neu zu gestalten - von biologischer Antriebskraft zu mechanischer Antriebskraft, von Pferdekutsche zu Verbrennungsmotor-Chassis. Dieser Vergleich ist wichtig, weil er die Essenz technologischer Revolutionen aufdeckt: Eine echte Innovation besteht nicht darin, neue Technologien auf ein altes Modell aufzuschlagen, sondern darin, den Umsetzungspfad grundlegend neu zu gestalten.
Es muss klargestellt werden, dass der "AI-Zwischenschicht" an sich nicht der falsche Weg ist. Sprachinteraktion, Intentionseingabe und intelligente Agenten sind alle unvermeidliche Trends in der Zukunft der Mensch-Maschine-Interaktion. Das Problem liegt nicht darin, AI als Vermittler einzuführen, sondern in der speziellen Umsetzungsmethode, die Doubao gewählt hat - die Automatisierung durch simuliertes Klicken. Dies ist genau eine Art von "Motor auf ein Pferd montieren" - eine vorübergehende Umsetzungsmethode: Die Körperstruktur des Pferdes (die UI-Oberfläche der Apps) ist nicht für den Motor (AI-Automatisierung) konzipiert. Das Ergebnis dieser zwangsweisen Kombination ist, dass sowohl die Mängel des alten Modells (Oberflächeninstabilität, Rechtebeschränkungen) beibehalten werden als auch die zusätzlichen Kosten der neuen Technologie (Überwachungsaufwand, Vertrauensangst) hinzukommen. Am Ende haben wir ein "mechanisches Pferd", das langsam läuft und leicht auseinanderfällt.
Diese Pfadgestaltung führt zu einem fatalen Mangel an Benutzererfahrung: die peinliche Halbautomatisierung.
Das Kernproblem liegt in der unklaren Vertrauensgrenze. Wenn Sie selbst tätig werden, wird jeder Schritt mit visueller und taktiler Rückmeldung abgeschlossen. Wenn etwas falsch läuft, können Sie es sofort bemerken und korrigieren. Aber wenn der AI-Assistent durch simuliertes Klicken für Sie tätig wird, müssen Sie am Ende einen Gesamtüberprüfungsschritt durchführen - würden Sie wirklich bereit sein, ein Flugticket zu buchen, ohne die Fluginformationen zu überprüfen? Würden Sie wirklich bereit sein, eine Nachricht zu senden, ohne den Empfänger und den Inhalt zu bestätigen? Diese zwangsweise Zweitbestätigung erweitert die ursprünglichen "3 Schritte" tatsächlich auf "Beobachtung der AI-Ausführung von 10 Schritten + manuelle Bestätigung von 1 Schritt". Die Aufmerksamkeit der Nutzer wird nie abgelenkt, sondern wird sogar noch intensiver, weil sie nicht in Echtzeit eingreifen können.
Doubaos Halbautomatisierung erreicht weder die Befreiung einer vollständigen Automatisierung noch die Kontrolle der manuellen Bedienung. Er gerät in eine "strukturelle Vertrauensproblematik" der Automatisierung - die Nutzer können sich nicht völlig zurücklehnen, aber auch nicht direkt eingreifen. Das eigentliche Problem dieser Benutzererfahrung liegt nicht darin, dass die Technologie nicht intelligent genug ist, sondern in der falschen Wahl des Umsetzungspfads. Wenn Sie sich entscheiden, die Benutzerbedienungen durch simuliertes Klicken "zu übernehmen", sind Sie dazu verdammt, dieser strukturellen Vertrauensproblematik zu begegnen.
Ein noch grundlegendeseres Problem besteht darin, dass sich das Handy in den letzten 20 Jahren dahin entwickelt hat, die Zwischenschichten zu eliminieren und Menschen direkt mit Informationen in Kontakt zu bringen. Von der intelligenten Vorhersage der Eingabemethode über die schnellen Bedienoptionen der Apps bis hin zu den Widgets, die alles auf einem Bildschirm zugänglich machen, alle Optimierungen zielen darauf ab, die Bedienungsschritte der Nutzer zu reduzieren. Die "Automatisierung" von Doubao durch simuliertes Klicken fügt tatsächlich eine komplexe, undurchsichtige Zwischenschicht wieder ein. Dies ist nicht die Frage, ob die Technologie fortschrittlich ist oder nicht, sondern ein grundlegender Rückschritt in der Benutzererfahrung.
Von den Dilemmata zum Ausweg
Doubaos drei Dilemmata offenbaren ein noch größeres Problem: Auf dem Super-Schlachtfeld des Handys, das von den Konzernen streng bewacht wird, ist der Versuch, die Kontrolle durch parasitäre Techniken zu erlangen, eine verlorene Schlacht. Dies bedeutet jedoch nicht, dass Doubao die AI-Hardware aufgeben sollte. Doubao verfügt über führende AI-Fähigkeiten in China, und das ist echtes Können. Das Problem liegt nicht in der Fähigkeit, sondern in der Art, wie diese Fähigkeit eingesetzt wird.
Da das Handy-Schlachtfeld so schwierig ist, müssen wir nach neuen Richtungen suchen. Indem wir direkte Konfrontationen mit den Konzernen mit hoher Zentralität vermeiden, eine nachhaltige Verbindungsart aufbauen und den richtigen Umsetzungspfad wählen, ergeben sich drei völlig verschiedene Modelle (Tabelle 1).
Die Auswahllogik dieser drei Modelle liegt jeweils anders: Modell 1 schafft eine Schutzmauer auf hoher Ebene, indem es die Hardware zum Betreuer der digitalen Vermögenswerte der Nutzer macht; Modell 2 konstruiert eine End-to-End-Closed-Loop in vertikalen Szenarien, die den Konzernen zu schwer fallen; Modell 3 umgeht die Oberflächenschicht der Super-Apps und baut eine symbiotische Verbindung auf Basis von APIs auf. Keines dieser Modelle versucht, die Nutzer-Handys und bestehenden Apps zu kontrollieren, sondern sie eröffnen neue Wertschöpfungspotentiale, indem sie die Geschäftsmodell-Elemente neu gestalten.
Tabelle 1: Drei Geschäftsmodelle für AI-Hardware
Modell 1: Lokaler Datenhub - Neu gestaltung des "Wertversprechens"
Kernlogik: Die Hardware wird zum lokalen Betreuer der digitalen Vermögenswerte der Nutzer und baut eine unverzichtbare Schutzmauer durch Datensammlung auf.
Der Schlüssel dieses Modells besteht darin, dass die Hardwareeinheit zum Mittelpunkt des digitalen Lebens der Nutzer wird, indem sie die wichtigsten digitalen Vermögenswerte lokal speichert und verwaltet - Account-Zugangsdaten, persönliche Präferenzen, historische Bedienaufzeichnungen, private Daten usw. Im Gegensatz zu Cloud-Services bringt die lokale Verwaltung drei einzigartige Vorteile mit sich: absolute Privatsphäre-Kontrolle,