StartseiteArtikel

Der aktuelle Stand chinesischer KI-Brillen: Hier ist die Transkription eines Salons | QbitAI-Salon

未来一氪2025-07-04 15:34
Das Salon analysiert den Weg für die chinesischen AI-Brillen, um die Stagnation zu überwinden. Die heterogene Zwei-Kern-Architektur + Cloud-Brain-Framework bringen die Branche an den Vorabend eines Aufbruchs.

Es heißt, dass die KI-Brillen ihren „iPhone-Moment“ erleben und die Branche kurz vor einem Ausbruch steht.

Allerdings ist die Einschätzung in der Branche: Die entscheidenden Herausforderungen haben gerade erst begonnen.

Warum?

Weil die Benutzer noch immer 2 - 3 Mal am Tag aufladen müssen, was einen grundlegenden Widerspruch zwischen Akkulaufzeit und der Anforderung an ständige Verfügbarkeit darstellt; weil die chinesischen Hersteller leicht von Meta in die Irre geführt werden können und den falschen technologischen Weg einschlagen; und vor allem, weil dieser Markt nicht wie der Smartphone-Markt von großen Konzernen dominiert werden wird.

Bei dem neuesten KI-Brillen-Salon von QbitAI haben vier Branchenexperten aus Xiaomi, Baidu Smart Cloud, Liweike Technology und Yingmu Technology frische und einzigartige Einblicke in die Branche gegeben.

Darüber hinaus: Wann werden KI-Brillen ein Standardartikel für die breite Masse sein? Warum wird es in Zukunft keine APPs mehr geben? Wie können Startup-Unternehmen in einem Markt mit vielen großen Konzernen Erfolg haben? Wie kann das Problem des Stromverbrauchs durch heterogene Doppelsysteme gelöst werden?

All diese Fragen, die sowohl innerhalb als auch außerhalb der Branche am meisten interessieren, wurden auch im Rahmen des Salons diskutiert.

QbitAI hat die geteilten Inhalte und die Roundtable-Diskussionen ohne Änderung der ursprünglichen Bedeutung bearbeitet. Wir hoffen, dass dies Ihnen neue Anregungen und Denkanstöße bietet.

Die eingeladenen Gäste dieses Salons sind:

Zhou Wenjie, Architekt von Xiaomi Xiaomi Vela

Kong Weijian, Leiter des Bereichs Spatial Intelligence von Baidu Smart Cloud

Zhang Jianhua, Partner und Leiter für Geschäftsinovation und Geschäftsentwicklung von Liweike Technology

Yang Longsheng, Gründer und CEO von Yingmu Technology

Der Weg zur Lösung der Probleme in der KI-Brillen-Industrie wird klarer

Heterogene Doppelsysteme lösen das Problem zwischen Akkulaufzeit und ständiger Verfügbarkeit

Zhou Wenjie, Architekt von Xiaomi Xiaomi Vela, hat die derzeitigen zentralen technologischen Herausforderungen in der KI-Brillen-Branche eingehend analysiert.

Er hat festgestellt, dass die Branche derzeit zwei Haupthindernisse hat: hoher Stromverbrauch und unzureichende ständige Verfügbarkeit.

Betrachtet man die Akkulaufzeit, so kann aufgrund der Gewichtsbeschränkung keine Batterie mit größerer Kapazität eingebaut werden. Die durchschnittliche Batteriekapazität in der Branche liegt nur bei etwa 300 mAh. Im Ein-SOC-Modus, insbesondere bei der Verwendung von Großkernprozessoren wie dem Qualcomm AR1, wird das Problem der Akkulaufzeit noch deutlicher. Die Benutzer müssen täglich 2 - 3 Mal aufladen, was zu einem sehr inkonsistenten Benutzererlebnis führt.

Was die „Always-On“-Funktion betrifft, erwarten die Benutzer, dass KI-Brillen sofort reagieren, kontinuierlich erfassen und ein nahtloses Erlebnis bieten können. Die Akkulaufzeit beschränkt jedoch die Möglichkeit einer echten ständigen Verfügbarkeit. Diese beiden Anforderungen stehen in einem grundlegenden Widerspruch zueinander.

Um dieses Problem in der Branche zu lösen, hat Xiaomi Vela ein heterogenes Doppelsystem entwickelt. Die Systemarchitektur besteht aus drei Ebenen: Der Vela-Kern basiert auf dem quelloffenen Echtzeit-Betriebssystem NuttX und verfügt über die Fähigkeit für heterogene Mehrkernprozessoren; die Dienstleistungs- und Framework-Ebene kapselt sechs Teilssysteme und integriert ein Edge-AI-Inferenz-Framework; die Anwendungs-Ebene unterstützt native APPs, schnelle Anwendungen und plattformübergreifende Anwendungen.

Das zentrale technologische Konzept besteht aus vier Schlüsselfaktoren:

Aufgabenabwälzung: Aufgaben wie Bildvorverarbeitung und einfache Sprachbefehle werden auf ein energieeffizientes SOC übertragen;

Fortlaufende Überwachung: Es wird eine 24/7-Sensor-Daten-Erfassung ermöglicht;

Anforderungsgesteuertes Aufwecken: Die Aufweckentscheidung wird über Gesten, Sprache usw. auf dem Kleinkern getroffen;

Nahtloses Erlebnis: Die Latenz wird durch nahtlose Umschaltung zwischen Groß- und Kleinkern reduziert.

Die Aufgabenabwälzungstechnologie von Xiaomi Vela deckt die Hauptfunktionsmodule von KI-Brillen ab. Bei der Anzeige werden für MicroLED-Einzel- und Vollfarb-Bildschirme alle Basisanzeigen wie Symbole und Navigation vollständig auf dem Kleinkern unterstützt, ohne dass auf Drittanbieter-SDKs zurückgegriffen werden muss. Bei der Audioverarbeitung werden die Erkennung von Aktivierungswörtern und der Audiokanal unabhängig auf dem Kleinkern ausgeführt. Das vollständige Protokoll-Stack für Bluetooth und WiFi wurde ebenfalls auf den Kleinkern portiert, um eine dauerhafte Verbindung auch während des Schlafens des Großkerns aufrechtzuerhalten.

Die technologischen Optimierungen haben bemerkenswerte Ergebnisse erzielt: Der Anzeigestromverbrauch wurde um 90%, der Audio-Stromverbrauch um 75% und der Bluetooth-Stromverbrauch um 60% reduziert. Der untere RPC-Kommunikationsdienst hat durch die Kapselung über verschiedene physische Übertragungen eine 70%-ige Erhöhung der Kommunikationsbandbreite erreicht und unterstützt die gängigen Betriebssysteme und Echtzeit-Betriebssysteme.

Das schnelle Anwendungsframework von Xiaomi Vela hat das Interaktionserlebnis speziell optimiert. Die durchschnittliche Startzeit beträgt 400 Millisekunden, und der Speicherbedarf pro Anwendung liegt nur bei 450 KB. Das Framework unterstützt die Entwicklung mit einem Quellcode für mehrere Bildschirme. Es werden über 1,5 Milliarden Geräte abgedeckt, es gibt über 30.000 Entwickler und über 750 Millionen monatlich aktive Benutzer.

Im Jahr 2024 hat Xiaomi Vela sich vollständig für die Open-Source-Community entschieden und OpenVela für globale Entwickler vorgestellt. Bereits 60 Hersteller haben sich dem Partnerschaftsprogramm angeschlossen, und 354 Chip-Plattformen wurden adaptiert.

In Zukunft könnten APPs nicht mehr existieren

Kong Weijian, Leiter des Bereichs Spatial Intelligence von Baidu Smart Cloud, hat die Entwicklungstendenz von KI-Brillen aus der Perspektive der Branchenentwicklung analysiert.

Er hat festgestellt, dass die gegenwärtigen KI-Brillen die Merkmale des iPhone 4-Moments aufweisen. Die ersten und zweiten Generationen der Ray-Ban Meta (intelligente Brillen, die von Meta und Ray-Ban zusammen entwickelt wurden) haben bis zum ersten Quartal dieses Jahres einen Absatz von etwa 4 Millionen Paar erreicht, und das mit Ray-Ban zusammengestellte Produkt hat das Ziel, bis Ende des Jahres 10 Millionen Paar zu verkaufen.

Kong Weijian hat die Marktteilnehmer in drei Kategorien eingeteilt:

Die erste Kategorie sind Hersteller von Audio-Hörgeräten, die KI-Brillen als ein Upgrade oder Ersatz für Hörgeräte positionieren;

Die zweite Kategorie sind integrierte Unternehmen, die Brillen als das nächste Generation-Endgerät definieren und das Smartphone ersetzen wollen;

Die dritte Kategorie sind Unternehmen, die Marketing- und Vertriebsleistungen anbieten und über starke Fähigkeiten im Bereich des Verbrauchermarktes verfügen.

Aus technologischer und praktischer Sicht hält er die Route, die auf Sprachaufzeichnung, Fotografie und einfache Interaktionen setzt für eine erfolgversprechende Lösung in den nächsten 2 - 3 Jahren. Die zentrale Idee besteht darin, zunächst 20% - 30% der Smartphone-Szenarien zu ersetzen.

Kong Weijian hat betont, dass der Aufstieg von KI-Brillen nicht nur eine Änderung der Geräteform darstellt, sondern auch eine Umgestaltung der Infrastruktur und des Interaktionsframeworks.

Von der mobilen Internet-Ära von Web2 zur AGI-Netzwerk-Ära von Web3 werden Anwendungen nicht mehr in Form von konkreten APPs existieren, sondern werden über ein verteiltes Netzwerk von Agenten automatisch abgerufen, zusammengefasst und aktiv an die Benutzer weitergeleitet.

Baidu Smart Cloud hat daher ein intelligentes Framework für die KI-Brillen-Cloud entwickelt, das die Sprach-, Text- und Bildverarbeitung in einem geschlossenen System integriert. Mit nur einem 300 KB-SDK-Paket auf der Edge-Seite können Android- und Linux-Systeme adaptiert werden, um den Endgeräten die Fähigkeiten von Ohren, Mund und Augen zu verleihen.

Bei der Audiooptimierung hat Baidu Smart Cloud den Schwerpunkt auf die Cloud gelegt, um Probleme wie hohen Stromverbrauch und schlechte Leistung auf der Edge-Seite zu vermeiden. Ein SDK enthält alle Funktionen wie Rauschunterdrückung, Verstärkung, VAD und Stimmensignaturerkennung. Basierend auf diesem Framework beträgt die Audio-Latenz vom Client bis zum Ende 1,3 Sekunden, die Sprachunterbrechung 0,8 Sekunden und die Bildverarbeitung vom Ende bis zum Ende weniger als 2 Sekunden.

Baidu Smart Cloud hat das Cloud-Framework für KI-Brillen wie folgt definiert:

Ein global verteilter, hochverfügbarer Rechenleistungssockel;

Drei Dienste, nämlich Audio-Enhancement-Service, Multimodal-Großmodell-Service und Cloud-Rendering-Service;

Vier Interaktionsformen, einschließlich Sprachinteraktion, Bildinteraktion, Digital-Assistenten-Interaktion und komplexe Aufgabeninteraktion.

Kong Weijian hat zusammengefasst, dass gute KI-Brillen drei Bedingungen erfüllen müssen: Erstens müssen sie gute Brillen sein, die modisch und maßgeschneidert sind; zweitens müssen sie ein Betriebssystem haben, das mit der AGI-Logik kompatibel ist; und drittens müssen sie über einen starken Cloud-Service-Zentralpunkt verfügen. Die zukünftige Architektur wird ein Service-Modell mit „leichtem Endgerät und starker Cloud“ sein.

Startup-Unternehmen können sich mit KI-Fähigkeiten durchsetzen

Zhang Jianhua, Partner und Leiter für Geschäftsinovation und Geschäftsentwicklung von Liweike Technology, hat offen über die Überlebensstrategien von Startup-Unternehmen gesprochen. Er hat offen zugegeben, dass das erste Produkt seiner Firma „von einem Pionier zu einem Opfertier geworden ist“ - es wog 87 Gramm und hatte einen hohen Stromverbrauch, und der Gesamtabsatz entsprach nicht den Erwartungen der Firma, obwohl diese Brille auf internationalen Messen wie der CES aufmerksamkeit erregte und von vielen Kollegen gekauft wurde.

Er hat die Hauptgründe analysiert:

Erstens war die Brille zu schwer. Ein Gewicht von 87 Gramm machte es für Menschen im Freien schon nach 2 - 3 Stunden unangenehm, sie zu tragen;

Zweitens gab es das Problem des Stromverbrauchs. Vor zwei Jahren war die Lieferkette für KI-Brillen noch sehr unausgereift;

Drittens hatte das 4G-Modul einen sehr hohen Stromverbrauch. Mit einer aktiven Datenskarte konnte es nur 40 Minuten lang betrieben werden, und bei gleichzeitiger Fotografie nur 15 - 20 Minuten.

Nach technologischen Verbesserungen hat Liweike Technology sich auf Audio-Brillen konzentriert. Zhang Jianhua ist der Meinung, dass Audio-Brillen für Verbraucher eine gute Möglichkeit sind, sich mit KI vertraut zu machen und in den Markt einz