Der nächste Stopp der künstlichen Intelligenz: Neue Konsumer-Hardware
Eine neue Welle der künstlichen Intelligenz (KI), die um große Modelle kreist, treibt weltweit die Entstehung einer Reihe von KI-nativen Unternehmen an. In dieser Forschungsreihe werden KI-native Unternehmen als solche definiert, die von Anfang an KI als Kernprodukt, -dienstleistung oder -fähigkeit nutzen und damit Wertschöpfung und Geschäftsinovationen anstoßen. Dies unterscheidet sie von Unternehmen, die KI lediglich in bestehende Geschäftsprozesse integrieren oder als Werkzeug einsetzen. Das Tencent Research Institute hat sich auf über 100 KI-native Unternehmen weltweit konzentriert und eine Reihe von Beobachtungen rund um drei Schlüsselfragen angestellt: 1) Welche neuen Technologien, Produktformen und Geschäftsmodelle werden von KI-nativen Unternehmen vorangetrieben? 2) Wie kann KI-Technologie tief in die Anwendungsfälle und Kernprozesse aller Branchen integriert werden, um die industrielle Aufwertung zu fördern? 3) Welchen Weg nimmt die KI-Ökosystementwicklung voran, und welche strukturellen Veränderungen bringt sie mit sich?
Im Gegensatz zu früheren Branchenanalysen, die sich meist auf die Entwicklung einzelner Technologien oder die Innovation einzelner Unternehmen konzentrieren, legt diese Forschungsreihe den Fokus auf die Ökosystemperspektive. Derzeit befindet sich die generative KI in einer Übergangsphase vom Werkzeug zum Plattformprodukt. Die Offenheit, Skalierbarkeit und Synergieeffekte des Ökosystems sind die Schlüsselvariablen, die die Branchenlandschaft bestimmen. Basierend auf der Analyse der Grundmodelle, auf denen KI-native Unternehmen aufbauen, wurden drei Ökosystemblöcke im Ausland identifiziert, die um OpenAI, Anthropic und Google als Kernelemente entstehen. Diese Auswahl beruht auf einer umfassenden Betrachtung der Fähigkeiten der Grundmodelle, der Attraktivität für Entwickler, der Ökosystemoffenheit und des industriellen Einflusses. Durch die Aufdeckung der Aggregationstrends und der Implementierungssituation globaler KI-Unternehmen bietet dieser Artikel eine Beobachtungsperspektive für die KI-Ökosystementwicklung in China.
I. Drei Entwicklungspfade für KI-Konsumer-Hardware
Seit 2023 hat die KI-Konsumer-Hardware eine hohe Innovationsrate in der Produktform gezeigt. Neue Produktkategorien wie KI-Smartphones, intelligente Brillen, Ringe, Kopfhörer und Begleitroboter sind schnell aufgestiegen. Gemäß dem Grad der KI-Nativität lassen sich drei Entwicklungspfade unterscheiden:
Pfad 1: Die Exploration eines neuen Paradigmas durch KI-native Geräte wie Rabbit
In den letzten zwei Jahren wurden mehrere KI-native Geräte eingeführt, die versuchen, sich von der Interaktionsparadigma des Smartphones zu lösen und einen neuen Weg der "Absicht als Aktion" zu finden. Diese Geräte reduzieren in der Regel die Bedeutung von Apps, Menüs und Fenstern und verlassen sich auf die semantische Verständnis- und Aufgabenausführungskapazität großer Modelle. Sie repräsentieren die Vorstufe von KI-nativen Geräten.
Typische Beispiele sind das Rabbit R1 und das Humane AI Pin. Das Rabbit R1 bietet eine physische Anzeige und eine Rollensteuerung, während das Humane AI Pin auf eine bildschirmlose Projektion setzt. Beide Geräte benötigen große Modelle, um Befehle zu verstehen und auszuführen. Dieser Ansatz umfasst auch Begleitroboter wie Loona und Ema, die auf Sprachinteraktion, Emotionserkennung und menschenähnliches Verhalten ausgelegt sind, um eine Begleitbeziehung und emotionale Bindung aufzubauen.
Insgesamt gesehen haben diese Produkte eine paradigmatische Innovation in der Interaktionsparadigma und Systemstruktur, ähnlich wie die frühen mobilen Geräte mit Palm OS. Doch aufgrund von unzureichender Benutzererfahrung, Stabilität und Benutzerakzeptanz sind ihre Zukunftsperspektiven noch sehr unsicher. Beispielsweise hat das AI Pin am 28. Februar 2025 alle Online-Funktionen eingestellt. Das Rabbit R1 wird weiterhin verkauft und aktualisiert, aber es muss mit einer geringen Benutzeraktivität, mangelndem Nutzen, Leistungsproblemen und Stabilitätsschwierigkeiten kämpfen, so dass seine Marktaussichten noch unklar sind.
Pfad 2: Der fortschrittliche Ansatz von Unternehmen wie Apple, um bestehende Geräte zu stärken
Im Gegensatz zur Entwicklung von KI-nativen Geräten von Grund auf repräsentieren Unternehmen wie Apple und Meta einen sichereren Technologieentwicklungspfad: Sie integrieren systematisch KI-Fähigkeiten in ihre bestehenden Endgeräte, um diese schrittweise zu verbessern.
Apples Apple Intelligence integriert lokale große Modelle (unterstützt durch die M-Serie-Chips) in seine Hauptprodukte wie Smartphones, Tablets und Computer. Dadurch werden Sicherheit, Leistung und Ökosystemkontrolle gewährleistet, während die KI-Fähigkeiten schrittweise verbessert werden.
Nicht nur Smartphones, sondern auch tragbare Geräte wie intelligente Brillen und Kopfhörer werden zu einer Erweiterung dieses Pfads. Produkte wie die Meta Ray-Ban intelligenten Brillen und die KI-Brillen von Xiaomi und Huawei integrieren Sprachassistenten, Bilderkennung und Übersetzungsnavigation auf der Grundlage ihrer traditionellen Formen, um die Grenzen der Mensch-Maschine-Interaktion zu erweitern. Kopfhörer, als die am häufigsten verwendeten tragbaren Geräte, beschleunigen ebenfalls den KI-Prozess. Marken wie Pixel Buds, AirPods und Nothing versuchen, die Fähigkeiten großer Modelle in die Kopfhörer zu integrieren, um Echtzeitgespräche, Informationssuche und Sprachsteuerung zu ermöglichen.
Insgesamt basieren diese Produkte noch auf der vorherigen Hardwaregeneration, verbessern aber die Interaktionserfahrung durch die Integration von KI-Fähigkeiten und stärken die KI-Eigenschaften der Geräte. Dieser Pfad ist sicher und bringt keine radikalen Veränderungen, sondern hat das größte Skalierungspotenzial.
Pfad 3: Der Ansatz von Unternehmen wie OpenAI, um alle Geräte mit KI zu versehen
Große Modellhersteller wie OpenAI verfolgen einen plattformbasierten Ansatz, der KI als Kernpunkt hat und alle Arten von Geräten mit KI-Fähigkeiten ausstattet. Für diese Hersteller ist es wichtiger, die starken KI-Fähigkeiten über Schnittstellen wie API und SDK in Drittanbietergeräte zu integrieren, um eine "allgemeine Intelligenz" für verschiedene Geräte bereitzustellen, anstatt eigene Hardware zu entwickeln.
Dieser Ansatz hat die Vorteile hoher Flexibilität und schneller Iteration und kann schnell in verschiedene Endgeräteformen eindringen. Beispielsweise bietet GPT-4o in Hardwareprodukten wie den Ray-Ban intelligenten Brillen und Be My Eyes Echtzeitgespräche und visuelle Wahrnehmung. Produkte wie die "Tongyi Tingwudao"-Kopfhörer von Alibaba und die Doubao-Kopfhörer nutzen eigene Modelle, um Sprachassistenten als Kernpunkt der täglichen Interaktion zu gestalten und ein intelligentes Erlebnis zu schaffen, das jederzeit aufgerufen und dauerhaft antworten kann.
Der Kern dieses Ansatzes besteht nicht darin, die Hardwareform oder das Betriebssystem neu zu gestalten, sondern die Modellfähigkeiten überall verfügbar zu machen, so dass jedes Gerät und jede Benutzeroberfläche mit KI verbunden ist. Schließlich soll ein intelligentes Ökosystem aufgebaut werden, in dem das Modell die Plattform darstellt.
II. Die Anfänge von Geschäftsmodellen für KI-Konsumer-Hardware
Mit der Differenzierung der Produktformen beginnen die Geschäftsmodelle für KI-Konsumer-Hardware sich abzuzeichnen. Durch die Analyse der aktuellen Hauptprodukte wurde festgestellt, dass die drei Entwicklungspfade jeweils eigene Geschäftsmodelle entwickelt haben, die sich an ihren Technologiepfaden und Produktpositionierungen orientieren. Jedes Geschäftsmodell hat auch seine eigenen Kernprobleme:
Tabelle 1: Vergleich der Hauptgeschäftsmodelle für KI-Konsumer-Hardware
1. Die Pioniergruppe der KI-Nativität: Ein "Zukunftswettlauf" mit hochpreisiger Hardware und Ökosystem-Abonnements
Das Kerngedanke dieses Geschäftsmodells besteht darin, aufgrund der revolutionären Interaktionsparadigma und der einzigartigen Hardwaregestaltung einen erheblichen Hardware-Preisaufschlag von frühen Adoptern und Benutzergruppen mit speziellen emotionalen oder einsatzspezifischen Bedürfnissen (z. B. Kindererziehung, Begleitung von Alleinlebenden, Haustierbesitzer) zu verlangen. Gleichzeitig bemühen sich diese innovativen Unternehmen, durch kontinuierliche Abonnementdienste (einschließlich Cloud-Service-Unterstützung, KI-Funktions-Updates, exklusive emotionale Interaktionspakete oder Inhaltspakete) einen stabilen wiederkehrenden Einnahmefluss aufzubauen und die Möglichkeiten der Ökosystemerweiterung zu erkunden. Dies kann beispielsweise die Verkauf von Zubehör, die IP-Lizenzierung und sogar die Planung eines zukünftigen Plattform-Gewinnmodells ähnlich wie dem eines Agenten-App-Stores umfassen.
Allerdings befinden sich die Pioniere der KI-Nativität in einer Schwierigkeit, den Wert ihrer Hardware zu beweisen. In funktionalen Szenarien können diese Produkte derzeit in Bezug auf Nützlichkeit und Benutzererfahrung nicht mit etabliertem Hardware wie Smartphones mithalten, und es wurden noch keine unersetzlichen dringenden Bedürfnisse identifiziert, die nur diese Produkte erfüllen können. Dies führt zu einer niedrigen Kaufquote der Benutzer. Ein typisches Beispiel ist das Rabbit R1, das mit einem Preis von 199 US-Dollar und einem Retro-Design auf den Markt kam und Momentanreaktionen und Sprachinteraktion ermöglichen kann. Aufgrund seiner Abhängigkeit von der Cloud, des geschlossenen Ökosystems und logischer Lücken hat es jedoch Probleme mit Funktionsinstabilität und schlechter Steuerungserfahrung. "Die meisten Funktionen haben im Vergleich zu Smartphones keine Vorteile", und es konnte die Grenze des "Szenario-Spielzeugs" nicht überschreiten. Darüber hinaus haben Testmedien Privatsphäre-Bedenken geäußert und bezweifelt, dass das selbst entwickelte LAM-Modell nur automatisierte Skripte zur Bedienung von Apps nutzt. Jetzt hat Rabbit sich auf die Softwareentwicklungskooperation konzentriert, um sich zu retten.
In Begleitungsszenarien kann der emotionale Preisaufschlag die funktionalen Mängel nicht verbergen und kann auch nicht den hohen Preis der Hardware rechtfertigen. Nehmen wir als Beispiel den Begleitroboter LOVOT der japanischen Firma GROOVE X. Sein Hardwarepreis von 3.935 US-Dollar und das monatliche Abonnement von 67 US-Dollar richten sich an reiche Menschen. Die spezielle Kleidung für den eingebauten Chip kostet hunderte bis tausende von Yuan, und normale Kleidung löst keine Interaktionsreaktion aus, was einen Zwangskonsumkreislauf bildet. Aber seine Interaktionslaufzeit beträgt weniger als eine Stunde und er muss häufig aufgeladen werden. Die Interaktionsspiele sind festgelegt und es gibt keine Fälle von individuellen Interaktionen (keine Sprachfähigkeit). Seit seiner Veröffentlichung vor fünf Jahren wurden weltweit nur 14.000 Geräte verkauft, was einer jährlichen Liefermenge von weniger als 3.000 Geräten entspricht.
Das Kernproblem der Pioniere der KI-Konsumer-Hardware besteht darin, dass die Benutzerbildungsarbeit kostspielig ist. Wenn die Produktleistung nicht weit über die bestehenden Endgeräte hinausgeht, ist es schwierig, die Hauptbenutzer zu gewinnen. Derzeit fehlt diesen Produkten im Allgemeinen die erforderliche Revolutionäre Kraft, was dazu führt, dass die Wertschöpfungskette zwischen der Hardwarepreisfestlegung und den Abonnementdiensten unklar ist und es schwierig ist, die Benutzer zur kontinuierlichen Bezahlung zu motivieren und die Bindung zu wahren. Letztendlich handelt es sich hierbei um ein hohes Risiko "Wettlauf" für die zukünftige Veränderung der Mensch-Maschine-Interaktionsparadigma.
2. Die fortschrittliche Stärkergruppe: Gewinn aus dem Vertrauten und Schaffung von Kompoundwirkungen durch Abonnements
Dieses Geschäftsmodell basiert auf etablierten Hardwareformen und verbessert die, indem es KI-Fähigkeiten systemisch integriert. Dies führt zu einer signifikanten Verbesserung der bestehenden Funktionserfahrung oder der Schaffung neuer Anwendungsfälle. Das Geschäftsmodell basiert hauptsächlich auf dem Verkauf von Hardware, um Marktanteile durch Markenstärke oder Kostengünstigkeit zu erlangen. Noch wichtiger ist, dass Unternehmen durch die Bereitstellung von Premium-Abonnementdiensten (z. B. individuelle tiefgreifende Gesundheitsanalysereports, professionelle Übersetzungsmotoren, kontinuierlich aktualisierte exklusive KI-Funktionen) den einmaligen Kauf von Hardware in einen langfristigen Nutzen für die Benutzer und einen kontinuierlichen Einnahmefluss umwandeln können, um den tieferen "Intelligenz"-Wert freizuschalten.
Der Kernvorteil liegt in der geringen Benutzerkognitionsbarriere und der hohen Marktabnehmbarkeit. In Bezug auf die Benutzererfahrung legt die fortschrittliche Stärkergruppe mehr Wert auf die Optimierung der lokalen KI-Rechenleistung. Das Apple-Endgerätemodell verwendet eine Zwei-Block-Architektur, die die Speicherauslastung und die Reaktionszeit reduziert und gleichzeitig das Cloud-PT-MoE-Modell einführt, um ein Gleichgewicht zwischen Effizienz und Intelligenz zu gewährleisten. Laut einer amerikanischen Umfrage im September 2024 hat Apple Intelligence die Zahlungsbereitschaft der Verbraucher um 11 % erhöht und ist für 54 % der potenziellen Smartphone-Käufer ein entscheidender Faktor. Das Abonnementmodell und die Endgeräte-KI-Fähigkeiten bilden zusammen die beiden Antriebsmotoren der Wettbewerbsfähigkeit. Das erste aktiviert den langfristigen Wert, und das zweite gewährleistet die Reaktionsgeschwindigkeit und die Privatsphäre und Sicherheit.
Aber es gibt immer noch Herausforderungen bei der Umsetzung des Abonnementmodells: Benutzer neigen dazu, keine Zahlungsbereitschaft für scheinbar intelligente, aber tatsächlich wenig wertvolle (flache) KI-Funktionen zu haben, insbesondere wenn es keine dringenden Anwendungsfälle gibt, um die Zahlungsbereitschaft zu stabilisieren. Gleichzeitig werden die Hardwareprodukte immer ähnlicher, und die Differenzierung hängt von tieferen KI-Fähigkeiten und Ökosystemkooperation ab.
Nehmen wir den Gesundheitsüberwachungsmarkt als Beispiel. Das Oura Ring hat wegen des Modells "499 US-Dollar Hardware + 5,99 US-Dollar monatliche Gebühr für die Freischaltung grundlegender Daten" die Benutzerwiderstände ausgelöst, insbesondere die fehlende Echtzeit-Gesundheitswarnfunktion hat seinen Wert geschwächt. Aber nachdem es sich in das Modell "Grundlegende Daten kostenlos + Abonnement für tiefergehende Gesundheitsdienste" gewandelt hat, hat die Zahlungsbereitschaft der Benutzer für intelligente Berichte wie individuelle Schlafanalysen und Krankheitsrisikoprognosen deutlich zugenommen, was die Abonnementkonversionsrate um 18 % erhöht hat. Dieses Beispiel zeigt, dass es nicht darum geht, ob es eine Gebühr gibt, sondern darum, dass die Benutzer einen kontinuierlichen und spürbaren intelligenten Servicewert spüren.
In Zukunft hängt der Erfolg des Abonnementmodells von zwei Punkten ab