StartseiteArtikel

Menschen gehen und Schachsteine fallen: Alibaba AI verabschiedet sich vom Idealismus

极点商业2026-03-04 19:41
The moment Qianwen put on the glasses, LIN Junyang chose to leave.

Wenn KI aus dem Labor hinausgehen und von der Technologie zum Geschäft, von der Software zur Hardware übergehen muss, was für ein Schachspiel spielt eigentlich die KI von Alibaba? Warum wurde gerade die Brille ausgewählt?

„Me stepping down. bye my beloved qwen.“ (Ich trete zurück, auf Wiedersehen, mein lieber Qianwen). Am frühen Morgen des 4. März hinterließ Lin Junyang, der Kernverantwortliche von Alibaba Qianwen, diese Worte in den sozialen Medien und erschütterte die Branche.

Dieser 1993 geborene und jüngste Technologieverantwortliche der Stufe P10 bei Alibaba war der Kernförderer des Open-Source-Modells Tongyi Qianwen. Diese Entscheidung kam „sehr plötzlich“ – Alibaba hatte gerade die Vereinheitlichung der Marke für das Large Language Model vorangetrieben, und Lin selbst hatte gerade das Qwen3.5-Serie Kleinmodell herausgebracht und die Interaktion mit Elon Musk geliked und weitergeleitet.

Es war nicht nur Lin Junyang. Am gleichen Tag kündigte auch Yu Bowen, der Verantwortliche für das Nachtraining von Qwen, offiziell auf. Der plötzliche Austritt mehrerer Kernmitglieder von Qwen bringt nicht nur Bedauern, sondern auch große Fragezeichen mit sich. Manche führen es auf die Unsicherheit bei der Kommerzialisierungseffizienz des Open-Source-Modells zurück – obwohl Qwen berühmt ist, wie viel Einnahmen aus API-Aufrufen in der Cloud es tatsächlich generieren kann, mag es bereits interne Meinungsverschiedenheiten bei Alibaba geben. Andere erwähnen, dass das am Silvesterabend vorgestellte Qwen-3.5 von internen Führungskräften als „Halbfertigprodukt“ bewertet wurde, und Lin Junyang hatte in der neuesten internen Sitzung Meinungsverschiedenheiten.

Im größeren Bild betrachtet ist der Austritt von Lin Junyang keine einfache persönliche Entscheidung, sondern ein Abbild der heftigen Kollision zwischen technischem Ideal und kommerzieller Realität, nachdem die KI-Strategie und die Organisation von Alibaba in die tiefere Phase eingetreten sind.

Fast gleichzeitig tauchte Jack Ma auf und sprach über KI, und Alibaba kündigte auch strategisch eine Stärkung des B2C-Marktes an – darunter startete das Qianwen KI-Brille offiziell die Vorkaufphase und wurde die erste Karte von Alibaba, um über KI-Hardware einen „Super-Eingang“ zu schaffen. Produkte wie KI-Ringe und KI-Hörer sind auch in enger Planung.

Einerseits geht der technische Soul-Charakter weg, andererseits wird ein wichtiger Zug in der KI-Hardware gemacht – es ist schwer zu sagen, dass es keinen Zusammenhang zwischen dem Gehen der Menschen und den Zügen im Schachspiel gibt, und es deutet auf dieselbe Kernfrage hin: Wenn KI aus dem Labor hinausgehen und von der Technologie zum Geschäft, von der Software zur Hardware übergehen muss, was für ein Schachspiel spielt eigentlich die KI von Alibaba? Warum wurde gerade die Brille ausgewählt?

Warum wählt Alibaba die Brille, wenn KI von der Software zur Hardware übergeht?

In den letzten Jahren hat der plötzliche Aufstieg von ChatGPT bewirkt, dass KI-Software mit einer bisher unbekannten Geschwindigkeit in alle Branchen eindringt. Texte schreiben, Illustrationen zeichnen, Code schreiben, Analysen durchführen – diese Aufgaben, die früher stark von menschlicher Intelligenz abhingen, sind heute mit KI-Unterstützung erreichbar.

Wenn jedoch die Algorithmen allmählich an ihre Grenzen stoßen, taucht ein tieferes Trend auf – das Schwergewicht der KI-Entwicklung verschiebt sich beschleunigt von der reinen Softwareanwendung in den Hardwarebereich. Von intelligenten Autos bis hin zu tragbarem Geräten, von KI-Smartphones bis hin zu Embodied AI, das heißt, KI geht von der virtuellen in die physische Welt über.

Zu Beginn des Jahres 2026 hat der Wettlauf um die B2C-Planung von KI-Hardware plötzlich zugenommen. ByteDance entschied sich für Smartphones, DingTalk setzt auf Aufnahmegeräte, und Alibaba setzt seine Wetten auf die Brille.

Wu Yongming, CEO der Alibaba Group, sagte einmal: „Die größte Vorstellungskraft von KI liegt nicht auf dem Smartphone-Bildschirm, sondern darin, die digitale Welt zu übernehmen und die physische Welt zu verändern.“ Diese Worte treffen auf die Essenz der Frage – damit KI wirklich nützlich ist, muss sie aus dem Bildschirm herauskommen. Dies bedeutet vielleicht von Anfang an, dass der Einfluss, den die sogenannte globale Open-Source-Community bringt, nicht das ist, was die oberen Führungskräfte von Alibaba wollen.

Warum setzt Alibaba also die Hoffnung auf einen Ausbruch der Anzahl der Benutzer von KI-B2C-Produkten auf die KI-Brille? Weil die Informationen in der realen Welt vom Bildschirm nicht erfasst werden können.

Wenn Sie auf einer lauten Straße ein Taxi rufen möchten, kann der Sprachbefehl von Lärm überdeckt werden. Wenn Sie auf eine fremdsprachige Speisekarte zeigen und diese übersetzen möchten, können Sie die Speisekarte nicht an die KI auf Ihrem Smartphone senden. Wenn Sie während des Radfahrens die Route aufzeichnen möchten, ist es bereits gefährlich, das Smartphone herauszunehmen. In diesen Szenarien kann die KI entweder nicht hören, nicht sehen oder nicht rechtzeitig handeln.

In der Vergangenheit konnte die KI die Welt nur durch die Umschreibung von Text oder Sprache verstehen, und diese Umschreibung selbst ist ein Informationsverlust. Qianwen will mit der Hardware ermöglichen, dass die KI selbst sieht und hört – und die Brille ist der beste Träger für die erste Person. Durch die Brille werden die sichtbaren Dinge erfasst, und durch die Kopfhörer wird die Umgebungsaudio wahrgenommen. Es geht von „ich höre, was du sagst“ zu „ich sehe und verstehe“.

Der Unterschied zwischen „die Bedeutung verstehen“ und „die Szene verstehen“ liegt nicht im Algorithmus, sondern in einem Paar Augen.

Hier verbirgt sich jedoch ein großer Streitpunkt – Datenschutz. Aus der Sicht des Benutzererlebnisses ist einer der größten Streitpunkte der KI-Brille das Datenschutzproblem. Wenn Sie die Brille tragen und die Welt betrachten, beobachtet die Brille auch alles um Sie herum. Das Risiko des heimlichen Fotografierens, die Datensammlung, das Recht auf Kenntnisnahme von der Drittperson …

Diese Probleme haben bei den Ray-Ban Stories von Meta schon eine große Aufregung ausgelöst, und einige Benutzer hatten sogar Konflikte wegen der Kamera in der Brille.

Wie wird Qianwen Brille die Angst vor Beobachtung behandeln? Der offizielle Standpunkt bleibt derzeit auf der physikalischen Ebene von „Anzeige der Aufnahmephase durch eine Leuchte“. Die echte Prüfung besteht darin, wen die Benutzerdaten gehören und wofür sie verwendet werden, wenn die Brille ein rund um die Uhr aktives Wahrnehmungsterminal wird. Die Antworten auf diese Fragen bestimmen eher die Lebensdauer des Produkts als die Hardwareparameter.

Konkurrenzdifferenz: Nicht in der Hardware, sondern in der Ökosystem

Wenn man nur die Hardwareparameter betrachtet, ist die Qianwen Brille nicht besonders herausragend: Zwei Flagschiffchips, Fünf-Mikrofon-Array, 40 Gramm Gewicht, 3K-Aufzeichnung. Diese Konfigurationen können Meta, Thunderbird und Xiaomi auch erreichen, und sie setzen sogar noch mehr Hardware ein.

Auf dieser Ebene ist es schwer, echte Differenzierung zu erreichen. Wenn Sie Chips setzen, können andere auch Chips setzen; wenn Sie das Gewicht reduzieren, können andere auch das Gewicht reduzieren. Wenn man nur auf die Hardware setzt, wird die Kosten letztendlich auf die Benutzer übertragen – es sei denn, die Marke ist bereit, Geld zu investieren. Meta und Xiaomi haben gerade das Vertrauen, „nicht von der Hardware zu verdienen“: Das erste hat eine globale soziale Ökosystem, und das zweite hat eine riesige IoT-Matrix.

Vielleicht ist in der Ansicht von Alibaba die echte Schutzmauer nicht in der Hardware, sondern in der Ökosystem und dem Benutzererlebnis. Und der Unterschied im Benutzererlebnis verbirgt sich genau an diesen Stellen: Essen bestellen, Hotel buchen, Taxi rufen.

Dies ist die erste Karte, die Qianwen Brille spielt – Ökosystem-Synergie. Wenn Sie an der Straße stehen bleiben und Ihren Blick auf ein Restaurant richten, brauchen Sie nur leise zu fragen: „Wie ist dieses Restaurant? Reservieren Sie mir einen Platz.“ Dann startet die Brille stillschweigend die visuelle Erkennung, ruft die Bewertungen von Gaode ab und schließt die Reservierung über Ele.me ab. Vom Moment, in dem Sie die Idee haben, bis zur Durchführung der Sache, liegt das Smartphone ruhig in Ihrer Tasche.

Das ist die Wirkung von „was Sie sehen, ist was Sie bekommen“.

Die meisten KI-Brillen auf dem Markt bleiben auf der Ebene der Informationsgewinnung: Foto machen, Video aufnehmen, Weg fragen. Die Benutzer fragen und gehen dann. Die Beziehung zwischen der Brille und den Benutzern endet mit der Frage und Antwort. Die Logik von Qianwen Brille ist ein geschlossener Transaktionszyklus. Qianwen ist nicht nur ein Chatbot, sondern ein Ausführungszentrum, das Dinge erledigen kann.

Können andere Hersteller dieses Erlebnis replizieren? Die Antwort ist: Schwer. ByteDance hat Doubao, aber keine geschlossene Ökosystem im Bereich des lokalen Lebens; Xiaomi hat eine Ökosystem, aber es ist auf das intelligente Heim gerichtet; Huawei hat Technologie, aber fehlt an einem Service-Netzwerk. Alibaba hat eine vollständige Service-Kette von Gaode + Ele.me + Alipay + Fliggy in der Hand – die Integration dieser Vermögenswerte ist äußerst schwierig, aber wenn es funktioniert, ist es die tiefste Schutzmauer.

Natürlich ist das Benutzererlebnis nicht von Natur aus vorhanden.

Die Benutzergewohnheiten müssen geprägt werden, das Service-Netzwerk muss kontinuierlich betrieben werden, und die Genauigkeit der visuellen Erkennung unter komplexen Lichtverhältnissen muss kontinuierlich verbessert werden. In diesem Wettlauf gibt es derzeit noch kein Produkt, das mehrere Längen voraus ist. Dies ist sowohl die Chance als auch die größte Herausforderung für Qianwen.

Mit anderen Worten: Die Hardware ist der Eintrittskarte, und die Ökosystem ist ein Marathon. Wer „verstehen“ in „erledigen“ umwandeln kann, kann wirklich in den Alltag der Benutzer einsteigen.

Vierfache Prüfung: Wenn die Grenzen der Ökosystem auf die Grenzen der Fähigkeiten stoßen

Die Wünsche sind einsache, die Realität ist eine andere. Wenn die Qianwen Brille wirklich ausbrechen will, muss sie mindestens vier Prüfungen bestehen.

Die erste Prüfung ist die Komplexität der Hardwareentwicklung.

Software kann heute programmiert und morgen online gehen. Die Entwicklungszeit für Hardware wird in Jahren gemessen und betrifft eine Reihe von Bereichen wie Optik, Akustik und Materialwissenschaft. Von einem einzelnen Produkt zu einer Multi-Produkt-Matrix steigt die Schwierigkeit der Supply-Chain-Management, der Qualitätssicherung und des Lagerbestandsmanagement exponentiell an.

Der Satz „Reservieren Sie mir einen Platz in diesem Restaurant“ beinhaltet vier Schritte: visuelle Erkennung (Erkennung des Restaurants), Semantikverständnis (Verständnis der Absicht), Serviceaufruf (Abfrage nach freien Plätzen), Zahlung und Leistungserfüllung (Abschluss der Reservierung). Wenn ein beliebiger Schritt stockt, wird das Erlebnis unterbrochen. Insbesondere die Genauigkeit der visuellen Erkennung unter komplexen Lichtverhältnissen und die Störunterdrückung der Sprachauslösung in lauten Umgebungen müssen in einer Vielzahl von realen Szenarien verbessert werden.

Die zweite Prüfung ist die Verbesserung des Benutzererlebnisses.

Bei Produkten wie KI-Brillen entscheidet jedes einzelne Merkmal, wie komfortabel es ist zu tragen, wie lange die Akkulaufzeit ist und wie natürlich die Interaktion ist, ob die Benutzer es gerne tragen. Die Qianwen KI-Brille ist mit einer 272 mAh-Batterie ausgestattet und hat eine nominelle Akkulaufzeit von 9 Stunden. Ob diese Konfiguration eine rund um die Uhr aktive Umgebungsintelligenz gewährleisten kann, hängt von der Marktreaktion ab. Die Rückgabesrate einiger KI-Brillen beträgt über 50%. Die Benutzer kaufen sie, tragen sie ein paar Tage und lassen sie dann vergammeln. Dies ist die realste Herausforderung für diese Art von Produkten.

Die dritte Prüfung ist der kontinuierliche Betrieb der Ökosystem.

Das Erlebnis von „was Sie sehen, ist was Sie bekommen“ beruht auf der Tiefe und Breite des hinteren Service-Netzwerks. Gaode,