StartseiteArtikel

Gespräch mit Yuanli Lingji's Tang Wenbin: Ich mag es nicht, Dinge zu sagen, an die ich nicht glaube, und ich kann nicht derjenige werden, den ich nicht sein will.

富充2026-03-30 14:40
Als Unternehmer, die die Ära von AI 1.0 erlebt haben, teilen sowohl Tang Wenbin als auch Yin Qi eine ähnliche Meinung bezüglich des erneuten Gründens eines Unternehmens: Die Essenz des Geschäfts liegt darin, Ausschlussverfahren anzuwenden.

Text | Fu Chong

Redaktion | Su Jianxun

Nach einem Jahr als Unternehmer trägt Tang Wenbin immer noch die Spuren seiner Zeit bei Megvii. In unseren Gesprächen verwendet er oft das Wort "Wesen" – ein beliebtes Wort innerhalb von Megvii.

Nach seinem Abschluss an der "Yao-Klasse" der Tsinghua-Universität gründete Tang Wenbin zusammen mit seinen Kommilitonen Yin Qi und Yang Mu im Jahr 2011 Megvii Technology. In diesem markanten Unternehmen der AI 1.0-Zeit liebte man es, nach dem "Wesen" zu fragen.

Während seiner 14-jährigen Zeit als Unternehmer bei Megvii erlebte Tang Wenbin den kompletten Auf- und Abstieg der AI 1.0-Welle. Von der rasanten Geschäftsentwicklung bis hin zu wiederholten Scheitern bei Börsengängen formten diese Erfahrungen auch sein Verständnis für das "Wesen".

Was die wichtigste Reflexion bei Megvii betrifft, meint Tang Wenbin, dass man nicht zu viele Fronten eröffnen sollte, sondern stattdessen erst einmal alle Kräfte konzentrieren und einen Geschäftsfeld mit dem größten Vorteil gründlich bearbeiten sollte.

Yin Qi, der kürzlich zum Vorsitzenden von Jieyue Xingchen ernannt wurde, äußerte sich in einem kürzlichen Interview ähnlich – das Geschäftsmodell ist im Wesentlichen eine Ausschlussmethode. Nach all den Hektik und Aufregungen versteht man besser, dass es besser ist, sich zu überlegen, was man nicht tun soll, anstatt viele Dinge zu tun.

Im März 2025 gründete Tang Wenbin die Unternehmen Yuanli Lingji für Embodied Intelligence. Bei seiner zweiten Unternehmung kann Tang Wenbin besser auf die Wesentlichen Dinge fokussieren.

Im vergangenen Jahr hat Yuanli Lingji nicht mit der Branche in Wettlauf um die Auftragsgröße geraten und auch nicht eilig versucht, eine "Hardware- und Software-ganzheitliche" Geschichte zu erzählen, um den Unternehmenswert zu steigern.

Im ersten Jahr von Yuanli Lingji wurde der Schwerpunkt auf die Modellentwicklung sowie auf die Arbeit an AI-Infrastrukturen wie Daten, Frameworks und Bewertungen gelegt. Denn nach Tang Wenbins Ansicht sind dies die Grundlagen, die die IterationsEffizienz bestimmen.

Die Fähigkeit, "immer vorne zu sein" im Sinne der Iteration, ist im Vergleich zu einer "kurzfristigen Vorsprung" eine wesentlich wichtigere Wettbewerbsfähigkeit.

Als er gefragt wurde, ob er aufgrund des "langsamen" Tempos Druck von den Investoren erfahren würde, sagte Tang Wenbin gegenüber "Intelligent Emergence": "Einige Unternehmen haben tatsächlich gute Gewinne erzielt, indem sie auf aufwendige Weise vorgegangen sind. Wir haben uns auch gefragt, ob wir das auch tun sollten. Aber dann haben wir uns klar gemacht, dass ich nicht gerne Dinge sage, an die ich nicht glaube, und ich kann auch nicht derjenige sein, den ich nicht sein will."

Er fasst die Veränderungen in seinen Jahren in drei Phasen zusammen: die blinde Selbstvertrauen der "ungefrorenen Jungtiere", die Verwirrung nach der Lektion der Realität, in der man "viele Dinge nicht weiß, wie man sie macht", und die heutige "bescheidene Selbstvertrauen" – man weiß, was man weiß, und man weiß auch genau, was man nicht weiß.

Die Schaffung einer Ära der maximalen Produktivität mit AGI-Allzweicrobotern ist Tang Wenbins jetzige Vision. Diesmal jedoch ist der Ansatz realistischer: Mit der Verbesserung der Modellfähigkeiten werden die Szenarien Schritt für Schritt freigeschaltet. Zunächst soll das Logistikgeschäft, in dem er bereits bei Megvii Erfahrungen sammelte, in einen kommerziellen Kreislauf gebracht werden.

Im Folgenden ist das Gespräch zwischen Tang Wenbin und "Intelligent Emergence", das vom Autor zusammengefasst wurde.

△Tang Wenbin, CEO von Yuanli Lingji, Foto: Vom Interviewer zur Verfügung gestellt

Das erste Jahr als Unternehmer: Das Schlüsselwort ist "Iteration"

Intelligent Emergence: Wenn Sie an das erste Jahr als Unternehmer bei Yuanli Lingji denken, welches Wort kommt Ihnen zuerst in den Sinn?

Tang Wenbin: Iteration. Im vergangenen Jahr hat sich viel verändert – technisches Verständnis, Datenlösungen, Szenarienauswahl, Finanzierungsrhythmus und so weiter. Wie in der Vergangenheit verändert sich auch die Embodied Intelligence schneller, als wir es erwartet haben.

Wir stehen heute vor einem Bereich voller Ungewissheiten. In der heutigen Embodied Intelligence-Branche ist die wesentliche Wettbewerbsfähigkeit eines Unternehmens nicht, wie weit es heute vorne liegt, sondern wie hoch seine IterationsEffizienz ist. Wer in der Lage ist, Probleme schneller zu erkennen und zu beheben, hat die Chance, immer vorne zu sein.

Intelligent Emergence: Das Gründungsteam von Yuanli Lingji kommt aus Megvii. Nach mehr als zehn Jahren als Unternehmer bei Megvii glauben Sie immer noch, dass es viele unerwartete Veränderungen bei der gegenwärtigen Unternehmung gibt?

Tang Wenbin: Ja, auch wenn wir aus der AI 1.0-Zeit viele Erfahrungen und Lehren gelernt haben.

Während unserer Zeit bei Megvii haben wir allmählich Probleme in den Bereichen Computer Vision, Autonomes Fahren und Large Language Models gelöst. Jetzt betreten wir den Bereich der Embodied Intelligence. Jedes Mal, wenn wir uns in einem neuen Bereich befinden, wissen wir nicht, was der genaue Weg ist. Aber aus der Vergangenheit haben wir gelernt, dass sich die Technologie schneller verändert, als wir es erwartet haben.

Das Gleiche gilt für den Bereich der Embodied Intelligence, in dem wir uns jetzt befinden. Wir müssen immer noch viele unbekannte Probleme lösen, was uns zwingt, unsere Ideen schnell zu iterieren.

Intelligent Emergence: Fühlen Sie sich noch immer aufgeregt, wenn Sie erneut als Unternehmer tätig sind? Wenn ja, woher kommt diese Aufregung?

Tang Wenbin: Ich denke, ob ich bei Megvii oder jetzt bei der Robot-Unternehmung bin, ich versuche immer, "die Probleme der Welt, die gelöst werden sollten, besser zu lösen". Dies ist auch die Aufregung, die wir als Ingenieure empfinden, nämlich "ich kann dieses Problem lösen".

Seit meiner Zeit bei Megvii habe ich eine einfache Einstellung entwickelt, die ich "Technikglaube, Wertorientierung" nenne. Einfach ausgedrückt, wir schaffen keine neuen Bedürfnisse. Wenn wir einen Roboter für emotionale Begleitung zu Hause schaffen, würden wir ein neues Bedürfnis schaffen. Aber was wir derzeit tun, ist es, bestehende Probleme mit besseren Werkzeugen zu lösen. Beispielsweise können Roboter die komplizierten und gefährlichen Arbeiten in der Industrie übernehmen, die zuvor von Menschen ausgeführt wurden.

Intelligent Emergence: Dies scheint eine sehr realistische Position zu sein, aber klingt es nicht vielleicht nicht so "attraktiv"?

Tang Wenbin: Ich denke, es hängt davon ab, wie man "attraktiv" definiert. Ich denke, dass wir in unserem Leben und in der Produktion viele Probleme haben, die bessere Lösungen haben könnten. Die Lösung dieser objektiven Probleme kann enorme Werte schaffen, sei es kommerzieller, sozialer oder Nutzerwert.

Wenn wir tatsächlich AGI-Allzweicroboter schaffen können, wird die Menschheit in eine Ära der maximalen Produktivität eintreten. Diese hohe technische Erwartung an sich ist bereits eine visionäre Zukunftsaussicht.

Den richtigen Szenario finden und die "Daten-Sperre" auflösen

Intelligent Emergence: Welches ist nach Ihrer Meinung das wesentliche Problem der Embodied Intelligence in der gegenwärtigen Phase?

Tang Wenbin: Es ist das Modell. Nur wenn das Modell stark genug ist, können die Szenarien freigeschaltet werden, und der Durchbruchspunkt des Modells liegt in den Daten.

Daten beseitigen im Wesentlichen die Unsicherheit. Das wirklich Wertvolle sind die Outlier-Daten. Nur wenn Sie den Roboter in die reale Welt setzen, hat er die Chance, Fehler zu machen und mehr "Fehlaufgaben" zu sehen, um die Unsicherheit zu verringern.

Intelligent Emergence: Es gibt viele Methoden zur Datenerfassung, sowohl Datenerfassungswerke als auch viele Embodied Intelligence-Unternehmen entwickeln Materialhandschuhe, Brustkameras und so weiter, um Menschen bei der praktischen Arbeit Daten zu sammeln. Welche Datenerfassungsmethode verwenden Sie? Haben Sie keine eigenen Datenerfassungswerkzeuge entwickelt?

Tang Wenbin: Wir haben auch unsere eigenen Datenerfassungswerkzeuge und kaufen auch externe Datenerfassungswerkzeuge und Daten. Aber die Werkzeuge sind nur Methoden, diese Lösungen sind nicht das Wesentliche.

Das Wesentliche ist, den Roboter in der realen Welt die Daten-Fließbewegung in Gang zu bringen und die Fehlfälle zu sammeln. Genau wie bei den Daten des autonomen Fahrens heute. Die Daten des reibungslosen Fahrens sind nicht selten. Das wirklich Wertvolle sind die Übernahme-Daten, d. h. die Daten, wenn der Algorithmus des autonomen Fahrens nicht funktioniert. Dies ist das, was die KI wirklich lernen muss.

Die derzeit verwendeten Methoden, ob es sich um Fernsteuerung oder um personenzentrierte Videos, Datenerfassungshandschuhe und so weiter handelt, simulieren in der Tat Szenarien, aber es handelt sich nicht um die Datenerfassung des realen Arbeitsplatzs, an dem der Roboter mit der physischen Welt interagiert. Das heißt, anhand dieser Daten weiß der Entwickler nicht, wo der Roboter auf der Grundlage der heutigen Logik tatsächlich fehlschlagen wird.

Intelligent Emergence: Ohne das Szenario gibt es keine Outlier-Daten, und ohne vielfältige Daten kann kein gutes Modell trainiert werden, das in der Lage ist, im Szenario zu arbeiten – dies ist eine "Sperre". Wie kann diese Sperre aufgelöst werden?

Tang Wenbin: Man muss das Szenario finden, das der gegenwärtigen Fähigkeit des Roboters entspricht. In der gegenwärtigen Phase sollten wir den Roboter als Azubi betrachten, nicht als vollwertigen Arbeiter mit hohen Erwartungen.

Wir haben einige Bedingungen für die Szenarienauswahl zusammengefasst: Erstens, Fehlertoleranz – die Konsequenzen eines Fehlers sind nicht schwerwiegend, oder es gibt jemanden, der die Verantwortung übernehmen kann; zweitens, Toleranz für den Takt – die Zeit, die der Roboter benötigt, um eine Aufgabe abzuschließen, ist derzeit nicht festgelegt, aber wenn er langsamer arbeitet, bricht der Aufgabenablauf nicht zusammen; drittens, Langzeitarbeit – andernfalls ist die Kaufpreis-Leistungs-Relation für den Kunden nicht rentabel; viertens, Generalisierbarkeit. Wenn die Aufgabe zu spezifisch ist, kann die nicht-standardisierte Automatisierung im Wesentlichen die Aufgabe erledigen.

Intelligent Emergence: Sie sagen, dass Yuanli Lingji derzeit hauptsächlich im Logistikbereich tätig ist. Ist das, weil es hier mehr Fehlertoleranz gibt?

Tang Wenbin: Auf den ersten Blick scheint die Logistik keine Fehlertoleranz zu haben. Wenn Sie beispielsweise eine Cola bestellen und sie nicht bekommen, ist das ein Fehler, und der Kunde wird beschweren. Aber die Logistik hat viele Prozessschritte, die durch die Systemgestaltung fehlertolerant gemacht werden können: Lassen Sie den Roboter zuerst arbeiten, und wenn er fehlschlägt, übernimmt der Mensch.

Außerdem ist die Taktanforderung in der Logistik nicht so hoch. Es gibt ungefähr zwei bis drei Wellen pro Tag. Es reicht, wenn diese zwei bis drei Wellen abgeschlossen werden. Es spielt keine große Rolle, ob es um 9 Uhr oder um 10 Uhr geschieht.

Intelligent Emergence: Ist Ihre Strategie in Bezug auf die Szenarien also "Eier auf dem Weg legen"?

Tang Wenbin: Mein Modell strebt letztendlich nach allgemeinen Fähigkeiten. Es ist nicht so, dass ich auf ein bestimmtes Szenario abzielen würde. Es ist eher so, dass im Prozess der Verbesserung der Modellfähigkeiten einige Szenarien allmählich freigeschaltet werden.

Deshalb mag ich es lieber, das gegenwärtige Modell und die Szenarien als eine "Winkelbeziehung" zu beschreiben. Die horizontale Achse repräsentiert die Szenarien, und die schräg nach oben verlaufende Linie repräsentiert die Modellfähigkeit. Die beiden sind nicht völlig getrennt, und sie stimmen auch nicht von Anfang an überein. Mit der Stärkung des Modells kann es immer mehr Szenarien abdecken, und der Winkel wird immer kleiner, bis er schließlich übereinstimmt.

△Tang Wenbin zeichnet auf der Tafel das "Winkeldiagramm" zwischen Modellfähigkeit und Szenariofreischaltung. Die horizontale Achse repräsentiert die Szenarien, und die schräg nach oben verlaufende Linie repräsentiert die Modellfähigkeit. Die Verbesserung der Modellfähigkeit wird schließlich in den Szenarien umgesetzt. Foto: Vom Autor aufgenommen

"Hardware- und Software-ganzheitliche" Lösung ist kein wesentliches Kriterium für die Unternehmensbewertung

Intelligent Emergence: Bei Megvii haben Sie sich auf den Logistikbereich konzentriert. Werden die Lösungen und Produkte, die Sie nach der Gründung von Yuanli Lingji an die Kunden ausliefern, sich unterscheiden?

Tang Wenbin: Einfach ausgedrückt, ob es sich um das Logistikroboter-Geschäft, das wir damals bei Megvii betrieben haben, oder um die Lösungen, die viele Kollegen heute anbieten, handelt, im Wesentlichen lösen sie alle das Problem des "Transportes". Das heißt, die Roboter ersetzen hauptsächlich die "Beine" der Menschen.

Aber die wirklich komplexeren "Handbewegungen" wurden bisher noch nicht gut gelöst. Beispielsweise das Greifen, Sortieren, Aufnehmen, Ablegen und Verpacken hängen immer noch stark von der menschlichen Arbeit ab. Wir möchten jetzt mit Yuanli Lingji, dass das Modell allmählich die Fähigkeit erlangt, diese Handbewegungen zu verarbeiten und es dann mit dem bestehenden System koppeln, um eine ganzheitliche Lösung zu bilden.

Intelligent Emergence: Wird Yuanli Lingji selbst die Hardware für die "Hände" herstellen?

Tang Wenbin: Die "Hand" ist eigentlich ein umfassender Begriff. Wir nennen es Endeffektor. Ein Zwei-Finger-Greifer ist eine Art, ein Drei-Finger-Greifer ist eine andere, und auch Vier-Finger- und Fünf-Finger-Greifer gehören dazu.

Ich glaube nicht, dass eine Konfiguration für alle Szenarien geeignet ist. In einigen Szenarien kann ein Drei-Finger-Greifer die Aufgabe erledigen, und die Kosten sind auch gering