StartseiteArtikel

Ein Dozent der Peking-Universität, der sich hartnäckig mit Robotergedächtnissen befasst, sprach mit uns über die größte "Voreingenommenheit" im Bereich der Embodiment.

富充2026-01-24 21:31
"Hardware-Software-Integration" ist vor der massenhaften Implementierung von Robotern eine Last, kein Vorteil.

Text | Fu Chong

Redaktion | Su Jianxun

Wie wird sich die Embodied AI (eingebettete Künstliche Intelligenz) 2026 entwickeln? Lu Zongqing, Dozent an der Fakultät für Informatik der Peking-Universität und Gründer von "Intelligence Without Bounds", wirft uns eine Einschätzung vor:

"Spaltung in Software und Hardware."

Software steht für das Modell als "Gehirn", Hardware für den Roboter selbst; die Spaltung bedeutet, dass verschiedene Unternehmen unterschiedliche Stärken haben und verschiedene Aufgaben übernehmen.

Das Gebäude, in dem "Intelligence Without Bounds" ansässig ist, das Dinghao Building in Peking, wird von einer Reihe namhafter AI - Institute wie dem Beijing Academy of Artificial Intelligence, Lingyi Wanwu und Galaxy Universal Intelligence eingenommen. Hier finden täglich Debatten über nicht - konsensfähige Ansichten in der Künstlichen Intelligenz statt.

Lu Zongqings Ansicht weicht stark von der gegenwärtigen Entwicklungstendenz der Embodied - Branche ab. Heutzutage streben die hoch bewerteten Start - Ups in der Embodied - Branche, seien es die "Unicorns" wie Zheyuan Robotics und Galaxy Universal Intelligence oder die stark finanzierte Xingdong Jiyuan und Xinghai Tu, konsequent das Ziel an: Ein integriertes System aus Software und Hardware, also eine Full - Stack - Lösung.

Trotzdem hat Lu Zongqing und sein 2025 gegründetes "Intelligence Without Bounds" sich entschieden, "gegen die Strömung" zu gehen und ein reines Software - Unternehmen zu werden, das sich nur auf die Entwicklung von Robotergehirnen konzentriert und nicht in die Hardwareproduktion einsteigt.

Intelligence Emergence hat aus exklusiven Quellen erfahren, dass "Intelligence Without Bounds" kürzlich die Angel - Runde abgeschlossen hat. Der Finanzierungsbetrag belief sich auf mehrere Millionen Yuan. Die Lead - Investoren waren die Koala Fund, eine Tochtergesellschaft von Lakala, gefolgt von Linghang Xinjie und Lingxin Qiaoshou. Die alten Aktionäre Lenovo Star and Xinglian Capital haben ihre Investitionen weiter erhöht.

"In der Embodied - Branche besteht eine ziemliche Vorurteilshaltung gegenüber reinem Software - Ansätzen, sowohl in China als auch im Ausland", sagt Lu Zongqing direkt. Er gibt ein Beispiel: Das amerikanische Start - Up Figure, das sowohl Software als auch Hardware entwickelt, hat einen um ein Vielfaches höheren Wert als das Unternehmen Physical Intelligence, das sich nur auf Embodied - Modelle konzentriert.

Allerdings hat ein großer Deal im amerikanischen Robotik - Sektor Anfang 2026 einen guten Anfang für die "Neubewertung von Embodied - Modellunternehmen auf dem Primärmarkt" gemacht: Am 14. Januar hat das Start - Up Skild AI in der Serie - C - Runde 1,4 Milliarden US - Dollar finanziert. Nach der Finanzierung hat sich sein Wert verdreifacht und liegt nun über 14 Milliarden US - Dollar. Somit ist es das erste Unicorn mit einem Wert von über 10 Milliarden Yuan in der Robotik - Branche 2026.

Dieser Deal bringt die Frage auf den Tisch: Wenn ein Modellunternehmen ein universelles "Gehirn" für verschiedene Roboter und Aufgaben entwickeln kann, müssen sich Embodied - Unternehmen dann wirklich die gesamte Technologie - Stapel auf die Schultern nehmen?

Genau dies will "Intelligence Without Bounds" beweisen - die Entwicklung von Embodied - Modellen, die über Marken und Formen hinweg funktionieren.

Zurzeit hat das Unternehmen das Dexterous Hand Manipulation Model Being - H - Serie entwickelt. Das Modell Being - M, das die Bewegung und Manipulation von zweibeinigen Robotern steuern kann, ist derzeit in der Entwicklung. Das neueste Modell Being - H0.5 kann bereits 30 verschiedene Roboter steuern. Dank der Optimierung der Inferenz kann es auch auf gängigen kleinen Robotermikrochips wie dem NVIDIA Orin - NX in Echtzeit laufen.

Die Kunden des Unternehmens umfassen bereits Hardware - Unternehmen wie PND und Lingxin Qiaoshou. Der kürzlich von PND und "Intelligence Without Bounds" gemeinsam veröffentlichte Adam - U Ultra - Roboter ist ein typisches Beispiel für die "Zusammenarbeit von Software und Hardware".

Nach der Integration des Being - H - Modells können die PND - Roboter mit hoher Bewegungsfreiheit "out - of - the - box" allgemeine Aufgaben wie die Aufräumung des Schreibtischs und die Sortierung und Scannung von Paketen ausführen. Mit der Wertschöpfungsdienstleistung Being - Dex von "Intelligence Without Bounds" können die Roboter in nur wenigen Stunden neue Aufgaben lernen, indem sie mit einer geringen Menge an Daten nachtrainiert werden.

Der Kern der obigen Fähigkeiten liegt in über 30.000 Stunden an vortrainierten Daten - wie Lu Zongqing erklärt, ist dies derzeit der weltweit größte Datensatz für das Training von Embodied - Modellen. Dahinter steckt ein einzigartiges "Menschliche Bewegungsvideos" - Konzept.

(Hinweis von "Intelligence Emergence": Hierbei bezieht sich "größter" speziell auf den Datensatz für das Vortraining von Embodied - Modellen.)

Dieses Konzept ermöglicht die Aufzeichnung von Handbewegungsvideos aus erster Person während des normalen menschlichen Arbeits - und Lebensablaufs mit Hilfe von Kopfkameras. Somit ist der Datensatz groß, die Kosten niedrig, und es können komplexe menschliche Handlungen vollständig aufgezeichnet werden. Im Vergleich dazu hängt das von den meisten Full - Stack - Unternehmen verwendete "Teleoperation - Sampling" - Modell von der manuellen Steuerung bestimmter Roboter ab und hat die Nachteile hoher Kosten, geringer Datenmenge und enger Bindung an die Hardware.

△ Die Kopfkamera kann Handbewegungsvideos aus erster Person aufzeichnen, ohne die normale Arbeit des Benutzers zu stören. Foto: Interviewperson

Ende 2023 begann Lu Zongqing mit der Verwendung dieses Datenkonzepts für das Modelltraining. Er erinnert sich, dass dieses Konzept damals keine große Resonanz gefunden hatte und die Branche hauptsächlich auf Simulations - und echten Roboterdaten setzte. Ab 2025 begannen jedoch mehr Robotik - Unternehmen, darunter Tesla Optimus, das Konzept der menschlichen Videodaten zu verwenden.

Lu Zongqing glaubt, dass 2026 mehr Unternehmen in der Branche den Wert der "Spaltung in Software und Hardware" erkennen werden. Der Grund liegt in der Wirtschaftlichkeit: Die reine Eigenentwicklung eines Embodied - Modells kostet jährlich mehrere Millionen oder sogar Hundermillionen Yuan, wenn man die Kosten für Grafikkarten und Personal berücksichtigt. Im Vergleich dazu kostet der einmalige Kauf eines Robotergehirns nur einige Zehntausend Yuan.

Nach seiner Meinung wird das "integrierte System aus Software und Hardware" aufgrund seiner umfassenden Ausrichtung vom Primärmarkt bevorzugt, aber in der Realität ist der Technologie - Stapel zu lang. Die Entwicklung von Modellen und die Herstellung von Hardware erfordern zwei verschiedene Fähigkeitssysteme, und es ist für ein Unternehmen schwierig, beide Bereiche tiefgreifend zu bearbeiten.

In den letzten Jahren haben sich daher einige Unternehmen ergeben, die "nur für die Full - Stack - Lösung" tätig sind. Sie haben VLA - Shells erstellt, Demo - Versionen, die scheinbar funktionieren, und so Finanzierungen erhalten, können aber in der realen Welt keine Gewinne erzielen oder werden aufgrund der Verwendung von Shell - Modellen in Bezug auf ihre technologischen Fähigkeiten in Zweifel gezogen. Dies hat dazu geführt, dass mehr Unternehmer die Schwierigkeiten und die Kosteneffizienz der Full - Stack - Strategie überdenken.

"Ich möchte keine Ressourcen auf die Hardware verschwenden, in der ich nicht so stark bin", sagt Lu Zongqing. Da die Technologie noch nicht ausgereift ist, sollten die Forschungsbemühungen so schlank wie möglich sein. Dies ist auch der Grund, warum er sich für die "Gehirnentwicklung" entschieden hat.

△ Lu Zongqing. Foto: Interviewperson

Im Folgenden finden Sie das Interview von "Intelligence Emergence" mit Lu Zongqing, das vom Autor bearbeitet wurde:

Die Aufteilung der Aufgaben zwischen Embodied - Modellen und Robotern wird klarer werden

Intelligence Emergence: Die führenden Embodied - Unternehmen in China setzen hauptsächlich auf das "integrierte System aus Software und Hardware". Wird "Intelligence Without Bounds" bei der Finanzierung Schwierigkeiten haben? Wie bewerten Sie diese Situation?

Lu Zongqing: "Intelligence Without Bounds" hat im Mai 2025 offiziell mit der Geschäftstätigkeit begonnen. Damals war es noch schwierig, für den reinen Software - Ansatz Finanzierungen zu erhalten. Die Situation auf dem amerikanischen Markt war ähnlich. Figure, das sowohl Software als auch Hardware entwickelt, hatte einen höheren Wert als Physical Intelligence, das sich nur auf Embodied - Modelle konzentriert.

(Hinweis des Autors: Im September 2025 lag der Wert von Figure bei etwa 39 Milliarden US - Dollar; im November 2025 lag der Wert von Physical Intelligence bei etwa 5,6 Milliarden US - Dollar.)

Ich denke, der Grund liegt darin, dass die Embodied - Branche eine völlig neue Branche ist. Am Anfang wusste niemand, wie die zukünftige Branchenstruktur aussehen würde. Deshalb waren die frühen Investoren eher bereit, Geld in Unternehmen zu investieren, die alles machen.

Aber der Unternehmenswert ist nur vorübergehend. Im Wesentlichen sagt er nichts darüber aus, ob das Unternehmen erfolgreich sein wird. Ich möchte ein Unternehmen wie OpenAI gründen, das zunächst eher auf die Forschung setzt, das erste "ChatGPT" entwickelt und dann kommerziell tätig wird.

Intelligence Emergence: Was bedeutet "ein erfolgreiches Unternehmen"? Oder anders ausgedrückt, was sind die Kernprobleme, die ein gutes Embodied - Gehirnmodell lösen sollte?

Lu Zongqing: Ich denke, es ist die Verleihung einer grundlegenden "Bewegungs - und Manipulations - Genetik" an Roboter durch das Vortraining des Modells.

Im Gegensatz zu Tieren wie Pferden und Rehen haben Menschen nicht von Geburt an eine hohe Bewegungsfähigkeit. Aber unsere menschlichen Gene geben uns eine gute Bewegungsbasis, die durch nachhaltiges Training entwickelt werden kann. Das Gleiche gilt für Roboter. Das vortrainierte Modell gibt den Robotern eine anfängliche Bewegungsfähigkeit, die "out - of - the - box" funktioniert.

"Intelligence Without Bounds" führt auch auf der Grundlage spezifischer Aufgaben ein Nachtraining auf verschiedenen Robotern durch. Wenn das vortrainierte Gehirnmodell stark ist, kann der Roboter in etwa 30 Minuten eine neue Aufgabe lernen.

Intelligence Emergence: Ein hoher Unternehmenswert bringt jedoch mehr Finanzmittel, die für die technologische Erforschung eingesetzt werden können. Kann dies in der Phase, in der die Technologie noch nicht ausgereift ist, die Wahrscheinlichkeit erhöhen, dass das Modellgeschäft erfolgreich wird?

Lu Zongqing: Aber ein hoher Unternehmenswert kann auch zu einer negativen Spirale führen. Unternehmen versuchen möglicherweise verschiedene Technologien und Geschäftsmodelle. Sie investieren viel Geld, aber erzielen keine Ergebnisse. Jedenfalls besteht kein absoluter Zusammenhang zwischen Unternehmenswert und Geschäftserfolg.

Intelligence Emergence: Können Sie jetzt Veränderungen auf dem Primärmarkt spüren? Welchen Grund sehen Sie dafür?

Lu Zongqing: Man kann jetzt sehen, dass die Unternehmenswerte von Embodied - Modellunternehmen immer höher werden.

Der Grund ist, dass aus geschäftlicher Sicht viele Robotermanufacturer jetzt mit uns zusammenarbeiten möchten. Nachdem sie sich die Frage "Kann die Eigenentwicklung eines Modells rentabel sein?" gestellt haben, haben sie allmählich erkannt, dass die Entscheidung, ob ein Embodied - Unternehmen ein eigenes Modell entwickelt oder nicht, im Wesentlichen ein geschäftliches Handeln ist. Ich denke, die Branche wird immer mehr in die Richtung einer Spaltung in Software und Hardware gehen.

Intelligence Emergence: Aus finanzieller Sicht kostet die Entwicklung eines guten Embodied - Modells jährlich mehrere Millionen bis Hundermillionen Yuan?

Lu Zongqing: Ja. Für ein Modell braucht man etwa 10 Mitarbeiter, was ein Jahresgehalt von 20 Millionen Yuan kostet. Die Rechenleistung ist auch sehr teuer. Wenn man 100 Maschinen mit je 8 Grafikkarten verwendet, kostet es etwa 3 Millionen Yuan pro Monat, wenn man A800 - Karten verwendet. Wenn man H200 - Karten verwendet, kostet es pro Monat 9 Millionen Yuan (einschließlich Speicher).

Das sind noch nicht die Kosten für Daten und andere Dinge. Die günstigsten Videos aus erster Person kosten derzeit etwa einige Zehn Yuan pro Stunde; Bewegungsaufnahmedaten kosten etwa einige Hundert Yuan pro Stunde.

Intelligence Emergence: Welches ist das aktuelle Zahlungsmodel von "Intelligence Without Bounds"? Warum ist es billiger als die Eigenentwicklung eines Unternehmens? Wird ein Hardwarehersteller befürchten, dass er nach der Spaltung in Software und Hardware von einem Modellunternehmen "übervorteilt" werden könnte, da er keine eigenen Software - Fähigkeiten hat?

Lu Zongqing: Derzeit wird für die Installation eines Roboters eine einmalige Lizenzgebühr in Höhe von einigen Zehntausend bis Hunderttausend Yuan erhoben. Für Unternehmen mit geringer Stückzahl ist dies immer noch billiger als die Eigenentwicklung. Darüber hinaus bieten wir die Nachtrainingsdienstleistung Being - Dex an, die auf der Datenmenge basiert.

Wenn ein Hersteller eine bestimmte Stückzahl erreicht, kann er eine Art SaaS - Jahresabonnement wählen. Zu diesem Zeitpunkt werden es auch mehrere Modellunternehmen geben, die miteinander konkurrieren. Somit muss der Hersteller nicht befürchten, dass ein Unternehmen "übervorteilt" wird.

Intelligence Emergence: Wenn die Technologie ausgereift ist und die Forschungs - und Entwicklungskosten sinken, wird der Roboterhersteller möglicherweise seine eigene Modellentwicklung aufbauen. Würde dies für ein reines Modellunternehmen eine Bedrohung darstellen?

Lu Zongqing: Wenn die Technologie wirklich ausgereift ist und ein universelles Modell viele Dinge tun kann, werden Roboter in die Haushalte kommen. Ich denke, dass in diesem Fall der Markt für Modellunternehmen noch größer wird und es sogar möglich ist, im B2C - Bereich tätig zu werden.

Es könnten dann große Softwareunternehmen wie Microsoft auftauchen; es könnte auch Unternehmen wie Huawei geben, die sowohl Software als auch Hardware herstellen. In diesem Stadium könnten wir möglicherweise auch über OEM - Modelle echte Roboterprodukte herstellen.

△ Ein PND - Roboter, der von dem Being - H - Modell gesteuert wird, scannt einen Paketaufkleber. Foto: Interviewperson

Im Jahr 2027 wird