Die vier AR-Unternehmen auf dem Aufstieg: Eine Zeit voller Chancen und Risiken
Von Pessimismus zu Optimismus
In letzter Zeit hat es sich bei den AI+AR-Brillen immer reger gemacht. Zuerst hat JBD, das "das Kernwissen der Technologie beherrscht", eine riesige Finanzierung erhalten, und dann hat ein südchinesisches Unternehmen, das diesen Jahr die größte Einzel-Finanzierung im Bereich hatte, allerdings mit einer "unbekannten" Summenhöhe, sich hervorgetan. Das Wasser im Frühlingstag ist endlich warm geworden, und ich bin wirklich froh für die vielen AR-Start-up-Unternehmen.
Als selbst ernanntes Kritiker, der in zwei marktführenden Unternehmen in der Branche gearbeitet hat, weiß ich sehr gut, wie unausgereift die Verbraucher-AR-Technologie noch ist und wie schwierig es ist, diese Technologie umzusetzen.
Vor zwei Jahren machten die Kern-Mikrodisplays und die Lichtmaschinen die Hälfte der BOM-Kosten aus, aber die Farbe und Helligkeit konnten immer noch nicht den Anforderungen entsprechen. Die Nahsicht-Anzeigeoptik ist komplex und es besteht noch kein Konsens darüber. Die Massenproduktions-Konsistenz und die Ausbeute sind sehr bescheiden. Bei all diesen hohen Kosten, die man zahlen muss, hat das fertige Endprodukt nur schwache Anwendungsfälle und sehr begrenzte Funktionen zur Erweiterung des Bildschirms und zur Information.
Verbraucher-AR ist keine echte AR. Wenn man gleichzeitig "Verbraucherprodukt" und "AR" erreichen will, kann es nur unecht sein.
Ein Beispiel: Selbst Apple hat Schwierigkeiten mit der Video-See-Through-Lösung. Unabhängig davon, wie weit die Optikmodule, Sensoren, Algorithmen und Rechenleistung entwickelt werden, müssen die Menschen im Grunde lernen, die Welt "durch eine Kamera wie durch ein Fernglas" zu betrachten. Dies scheint darauf zu warten, dass sich der Homo sapiens weiterentwickelt. Die Aussichten des Apple Vision Pro auf dem Verbrauchermarkt sind ungewiss.
Bild des maßgeschneiderten Optikmoduls des Apple Vision Pro
Eine Gruppe von Ungezogenen: Die Optic-See-Through-Lösung und teilweise die lichtdurchlässige BirdBath-Lösung können von Verbrauchern tatsächlich akzeptiert werden. Aber um eine vollständige AR zu realisieren, muss man ein Helm herstellen, was nur für den B2B-Markt geeignet ist, nicht für den B2C-Markt. Was ist eigentlich die AR der vier chinesischen AR-Titanen, wenn es keine Verbraucher-AR mit Echt-Fiktion-Interaktion gibt? Und es gibt fast keine Apps. Die Käufer lassen die Produkte einfach verstauben. Ohne Wiederholungskäufe und stabile Gerätewechsel müssen die Unternehmen ständig neue Märkte erschließen. Die Verbraucher-AR, repräsentiert durch die BirdBath-Lösung und die Wellenleiter-Lösung, ist ein sehr junger und marginaler Markt. Unternehmen müssen sich bemühen, um Finanzierungen zu erhalten und am Leben zu bleiben.
Bild des INMO Air 2
Ende 2022 hat ChatGPT-3.5 weltweit Bekanntheit erlangt und hat in der scheinbar nicht direkt damit verbundenen Verbraucher-AR-Branche einen perfekten Sturm ausgelöst. Die Weiterentwicklung der LLM-Technologie ist nicht nur die wichtigste Schlüsselvariable für die Verbraucher-AR-Kategorie. Die Anzahl der möglichen Produktkombinationen, Anwendungsfälle und Funktionen hat plötzlich stark zugenommen. Für viele internationale und chinesische Großkonzerne sind AR-Brillen mit hoher Transparenz, die man im Alltag tragen kann, das beste Hardware-Paradigma für die Implementierung von LLM.
Theoretisch kann man über die API eines Cloud-basierten Large Language Models (LLM) in Echtzeit Sprache, Text, Bilder und Videoströme empfangen, erkennen und generieren. Ihre Brille kann die Welt auf einem multimodalen Niveau verstehen und Ihre Vorlieben kennen. Wie der Redakteur des bekannten internationalen Tech-Blogs The Verge sagte: "Ich fühle mich wie Tony Stark (Iron Man), und Gemini (ein von Google entwickeltes LLM) ist mein J.A.R.V.I.S."
Große Sprachmodelle und Generative Diffusion Modelle befinden sich in einem globalen Wettlauf. Höhere Intelligenzagenten, die End-to-End-Training und parallele Aufrufwerkzeuge nutzen, und GUI-Agenten, die "Elemente" auf dem Bildschirm erkennen und auf der Grundlage von Langzeitplanung mehrstufige Aufgaben ausführen können, haben großes Potenzial auf der Anwendungsseite. In diesem Jahr wurde nach dem Training des Reinforcement Learnings die Gedankenkette erweitert, um ein neues Skalierungs-Paradigma einzuführen. Weiterhin haben Weltmodelle, die die physische Realität verstehen, vorhersagen und 3D-Inhalte generieren können, ein enormes Vorstellungsvermögen. Selbst "unbrauchbare" Wellenleiter-Brillen mit einer schmalen und grünen FoV können zu einer neuen Generation von AI+AR-Verbraucherelektronik werden.
Ein zweiter, jederzeit anrufbarer Gehirnhelfer, der über die ursprünglichen "Head-mounted-Computer" hinausgeht und die reale Welt in Echtzeit visuell verbessert, könnte theoretisch mit der Weiterentwicklung der Large Language Models so nah wie nie sein. Die Entwicklung von GUI-Agenten, die Langzeit-Schlussfolgerungen ermöglichen und eine einheitliche Architektur zur Verarbeitung multimodaler Informationsströme aufweisen, könnte neue technische Wege eröffnen und die bisher erforderlichen Prozesse zur Ortung, Kartenerstellung und Rendering für die Realisierung von AR-Funktionen erheblich vereinfachen. Die Rechenleistung für die Schlussfolgerungen liegt in der Cloud, während Sensoren und die grundlegende Mensch-Maschine-Interaktion am Endgerät stattfinden. Dadurch wird das Innovationspotenzial und die Produktfreiheit plötzlich erweitert.
Technologischer Fortschritt treibt die Erweiterung von Funktionen und Anwendungsfällen voran und verringert die Komplexität und Kosten für die Realisierung bestimmter Funktionen. Dies ist ein typischer Prozess, bei dem technologische Innovation neue Produktkategorien und neue Bedürfnisse schafft.
Die vier chinesischen AR-Titanen: "Gefahr" und "Chance" gehen Hand in Hand
Es sind nicht wie die berühmten Vier Großmeister aus der Martial-Arts-Welt, aber die vier chinesischen Verbraucher-AR-Titanen sind in den Norden, Osten, Süden und Westen verteilt. Das Unternehmen im Norden hat Geld aus Shanghai erhalten und sich in den Osten verlagert. Ein weiteres Unternehmen aus Shenzhen im Süden hat sich in den Westen, nach Chengdu, verlagert.
Angesichts der Versprechen der nächsten Generation von AI+AR-Verbraucherelektronik haben ausländische Unternehmen wie Meta, Google, Microsoft und Apple jahrelang anstrengend an der Forschung und Entwicklung gearbeitet, Schlüsseltechnologieunternehmen erworben und ein umfangreiches Patentportfolio aufgebaut. Sie sind alle bereit, wenn der Markt startet, ihre besten Karten auf den Tisch zu legen.
Metas Ray-Ban-Brillen waren eine wahre Wucht. Sobald der Audio und die AI-Optimierung ein gewisses Niveau erreicht hatten, hat der Markt explodiert. Meta setzt weiterhin seine finanzielle Macht ein. Das Orion-Modell nutzt Siliziumcarbid als Wellenleiterbasis und hat eine FoV von bis zu 70°. Dies ist für eine leichte Wellenleiter-Brille beispiellos. Das Wellenleiter-Layout des Orion mit der Pupillenvergrößerungslösung ist faszinierend. Der dreifarbige Micro-LED-Lichtmotor mit drei Farben hat eine akzeptable Helligkeit. Vor allem wird das Vorwärtslichtleck reduziert und der Wellenleiter wird "optisch versteckt". Dies ist bei einer Array-Wellenleiter-Brille bemerkenswert. Man kann es im Alltag tragen, ohne dass es wie eine AR-Brille aussieht.
Bild der detaillierten Darstellung des Meta Orion
Meta hat mit dem Orion ein perfektes High-End-Beispiel gesetzt, und die Ray-Ban Display-Brillen setzen dann präzise auf die richtigen Konfigurationen auf. Wenn man Meta als die nächste Apple ansieht, ist es bemerkenswert, dass die Aktien von Meta derzeit auf einem niedrigen Niveau handeln.
Haben die spät aufmerksamen Medien und Verbraucher bemerkt, dass der "iPhone-Moment" für die Verbraucher-AR vielleicht schon hier ist?
In China beginnen ByteDance, Alibaba, Tencent, Baidu und sogar Huawei, sich ernsthaft mit AI-Brillen zu beschäftigen. Darüber hinaus gibt es ein berühmtes Unternehmen, das gut darin ist, mit Unternehmen zu kommunizieren und dann Mitarbeiter mit einem Vielfachen ihres Gehalts zu rekrutieren. Es beobachtet im Schatten und ist besonders gut darin, schnell Marktanteile zu gewinnen, indem es seine starke Markenpräsenz nutzt. Dann nutzt es diese Macht, um im Lieferkettenhandel günstige Konditionen zu erzielen und Produkte mit einem hervorragenden Preis-Leistungs-Verhältnis zu entwickeln.
Wenn die Giganten eintreten und die "Putzkräfte" in den Markt eintauchen, werden die vier chinesischen AR-Titanen bald einer ernsten Marktprüfung ausgesetzt sein. Ihr Fehler besteht darin, dass sie möglicherweise die MVP-Validierung für die Großkonzerne durchführen.
Das Unternehmen aus Shenzhen im Süden verfolgt einen Zwei-Strategie-Ansatz. Die X-Serie verfügt über einen RGB-dreifarbigen Micro-LED-Lichtmotor, der dem Meta Orion ähnelt, aber es war früher und aggressiver als Meta. Zusammen mit einem einfarbigen Wellenleiter-Display ist dies ein sehr riskanter Ansatz, den nur wenige Unternehmen wagen. Nach mehr als zwei Jahren Iteration ist es das einzige Unternehmen in der Branche, das dieses Produkt tatsächlich in Massenproduktion bringt und verkauft. Der Preis liegt nahe an 10.000 Yuan. Obwohl die Kernkomponenten des Lichtmotors aus der Lieferkette stammen, verdient das Bemühen, das während der Massenproduktion geleistet wurde, einschließlich der Anpassung der Geräte, der Umsetzung der Ätzprozesse mit Anwendungs-Materialunternehmen und der Verbesserung des SRG-Wellenleiter-Display-Layouts, Bewunderung.
Aber die Produktstrategie der anderen Produktlinie, der Air-Serie mit der BB-Lösung (BirdBath), ist fragwürdig. Ist es wirklich sinnvoll, ein so kleines Mikrofon in den so kleinen Bügeln der Brille zu integrieren? Aufgrund der begrenzten Größe der Mikrofonmembran ist die Klangqualität begrenzt. Benutzer, die eine private Filmansicht bevorzugen, würden eher ein Bluetooth-Hörgerät tragen. Über die Effektivität des neuen Bildqualitätschips lässt sich ohne praktische Erfahrung nicht urteilen, aber es scheint, dass es mehr auf den Hype als auf die tatsächliche Leistung abzielt. Die Einführung von einzigartigen und fortschrittlichen Innovationen in das Linsenmodul, die Feinabstimmung der Optik und die Balance zwischen Mensch-Maschine-Engineering wären für die Benutzer wertvoller und die Effekte wären direkter. Die Größe des FoV und die Größe des virtuellen Bildschirms können nur die Benutzer täuschen.
Das Unternehmen aus Hangzhou hat zwar einige Gerüchte, die schwer zu überprüfen sind, aber Misa ist der geekigste Unternehmer, den ich je kennengelernt habe. Die neuesten Wellenleiter-Brillen sind immer noch nur in Grün. Der Lichtmotor des Light Canoe, der zwei Displays antreibt, kann die Kosten effektiv senken. Im Vergleich zu den früheren Zwei-Brillen-Lösungen ist die Schwierigkeit, das Licht korrekt einzukoppeln, deutlich verringert. Das Wellenleiter-Layout scheint später etwas angepasst worden zu sein, um das Vorwärtslichtleck zu reduzieren. Die Brille kann direkt an den Brillengläsern eines Myops angebracht werden. Das Unternehmen bemüht sich, die Brille in eine normale Form zu bringen.
Die andere Produktlinie mit der BirdBath-Lösung ist durchschnittlich. Das Gesamtgefühl des Produkts ist tatsächlich gut. Das Design der Optik und des Aufbaus hat eine einzigartige Ausrichtung auf den Verbraucher. Auf einigen Details wird der Benutzererlebnis geachtet, und man kann kaum etwas auszusetzen. Ich finde jedoch, dass die Funktion zur Anpassung der Myopie, die aus der Lieferkette stammt, etwas zu naiv ist. Die meisten Myopen haben auch Astigmatismus, und wenn man diesen nicht korrigieren kann, muss man immer noch ein zusätzliches Brillenglas hinzufügen.
Bei meinen begrenzten Kontakten mit Misa habe ich das Gefühl, dass er ehrlich und aufrichtig ist und nur wenige hinterhältige Tricks spielt. Er legt immer großen Wert auf die Rückmeldung der Benutzer. Er muss auf einem Seil zwischen Produktiteration, Massenproduktion und Kosten balancieren. Er hat auch frühzeitig die Grenzen der Hardware erkannt und hat begonnen, die System- und Software-Entwicklungsekosysteme aufzubauen. Dies ist sehr vorausschauend.
Aber das Produkt ist immer noch nicht "hart" genug. Es fehlt an Radikalität und Endgültigkeit. Die Heranziehung von Lösungen aus der Lieferkette hat nur begrenzte "Originalität". Obwohl das Unternehmen auf das gesamte Industriedesign, die Bearbeitung von Details, das System und die Software-Ekosysteme Wert legt, sollte es zumindest ein "Hardware-Konzeptmodell" entwickeln, das die Öffentlichkeit beeindruckt und zu Diskussionen anregt, um den Vorstellungsraum des Unternehmens zu erweitern. In einer Branche mit hoher Unsicherheit und hohen Risiken ist es das größte Risiko, ein "ehrlicher Mann" zu sein.
Das Unternehmen aus Shanghai hat einen etwas hochnäsigen Geschäftsführer, aber es hat die besten BirdBath-Brillen. Es hat ständig an den Schlüsselkomponenten des Lichtmotors und den zugehörigen Modulen gearbeitet und verfügt über das tiefste technologische Know-how. Die Entscheidung von Google, mit diesem Unternehmen eine OEM-Partnerschaft einzugehen, ist nicht nur eine Marketing-Strategie. Das neueste Produkt, das X-prism, hat mich besonders beeindruckt. Es scheint, dass es von der Idee des maßgeschneiderten mehrschichtigen Pancake-Linsensystems des Apple Vision Pro inspiriert wurde - ein ultra-dünnes Optikmodul mit einem extrem kurzen Brechungs- und Reflexionslichtweg. Das neue Produkt von Shanghai hat möglicherweise eine zusätzliche Umlenklinse, was die Dicke des Moduls reduziert und die FoV vergrößert. Darüber hinaus wurde die Unterdrückung von Streulicht am unteren Rand der Linse verbessert.
Aber das Unternehmen aus Shanghai hat nur eine Produktlinie. Im gesamten Markt ist die BirdBath-Lösung eindeutig eine Übergangslösung. Die Positionierung als marginaler Markt ist schwer zu überwinden. Die Betonung der Trennung von Hauptgerät und Display, die Eigenentwicklung von Chips und die