StartseiteArtikel

Das Embodied AI-Unternehmen, das den "Gehirn" für Unitree entwickelt, hat mehrere Hundert Millionen Yuan an Kapital beschafft, und Sequoia China hat investiert.

富充2026-02-27 10:11
Im Jahr 2026 hat sich die Logik der Investoren, die auf Embodied Intelligence setzen, geändert: Sie wollen sehen, dass Roboter bei "einer konkreten Aufgabe" von Kunden wiederholt gekauft werden.

Text | Fu Chong

Redaktion | Su Jianxun

Während unserem Interview mit der Embodied AI - Firma "Zhongke Fifth Epoch" ereigneten sich nacheinander zwei Dinge.

Das erste Ereignis war, dass im Januar 2026 Zhongke Fifth Epoch den Titel "Kern - Ökosystem - Partner" von Unitree Technology erhielt. Im B2B - und industriellen Sektor ist Zhongke Fifth Epoch derzeit der Anbieter des "Gehirn" - Modells für Unitree - Roboter.

Das zweite Ereignis war, dass Zhongke Fifth Epoch in letzter Zeit die Pre - A - und Pre - A+ - Finanzierungsrunden erfolgreich abgeschlossen hat. Beide Transaktionen wurden innerhalb eines Monats abgeschlossen, und das Volumen belief sich auf mehrere hundert Millionen Yuan. In der Pre - A - Runde wurde die Beteiligung von Sequoia Capital China angeführt, gefolgt von Oriental Fortune Capital. In der Pre - A+ - Runde wurden die Beteiligungen von Xinneng Venture Capital und Youshan Capital gemeinsam angeführt, gefolgt von Tsinghua Holdings GoldenTrust Investment.

Liu Nianfeng, Gründer und CEO von Zhongke Fifth Epoch, meint, dass es einen Zusammenhang zwischen diesen beiden Ereignissen gibt. Der Kernlogik ist, dass die Primärmärkte die Roboter realistischer einschätzen.

"Letztes Jahr neigten die Investor*innen eher zu einem universellen Erzählmodell der Embodied AI, wie etwa zu Robotern, die 'Kisten tragen, Tische aufräumen und Kleidung falten' können. Jetzt wird jedoch eher darauf geachtet, ob man sich zunächst auf vertikale Szenarien konzentrieren und die Kunden zur Wiederholungskäufe motivieren kann. Dies betrifft die Vermarktungsfähigkeit und auch die Möglichkeit, die Engpässe bei Mangel an echten Roboter - Daten über die Daten - Flywheel - Strategie zu überwinden." Liu Nianfeng erklärte der Zeitschrift "Intelligent Emergence".

Die Zusammenarbeit zwischen Zhongke Fifth Epoch und Unitree ist die Umsetzung dieser Aufteilung der Arbeit in "Körper" und "Gehirn". Seit 2025 haben beide Seiten allmählich Tests, Validierungen und Umsetzungen in Szenarien wie der Stromüberprüfung und der Industrie durchgeführt.

△ Ein Unitree - Roboter mit dem "Embodied Brain" von Zhongke Fifth Epoch zeigt die Transportarbeit in einem industriellen Szenario. Foto: Interviewer/in

Neben der Rolle als "Gehirn - Anbieter für Unitree" bietet Zhongke Fifth Epoch auch direkt umfassende Roboterlösungen für Branchenkunden an.

In ihrem Büro in Peking sahen wir einen Roboter, den Zhongke Fifth Epoch für einen führenden zentralstaatlichen Staatsunternehmen - Kunden maßgeschneidert hat. Dieser in rot lackierte Roboter wird bald in den Einzelhandelsgeschäften Waren verkaufen und in Zukunft auch an Tankstellen Autos betanken. Darüber hinaus werden auch Bestellungen für die Inspektion und den Transport für Branchenkunden schrittweise vorangetrieben.

Zhongke Fifth Epoch wurde im September 2024 gegründet und hat in etwas mehr als einem Jahr bereits viele renommierte Unternehmenskunden wie Unitree gewonnen. Wenn es um die Methodik der Auftragsgewinnung geht, sagt Liu Nianfeng, dass es jetzt nicht schwer ist, Kunden zu finden, sondern die Lieferung schwierig ist - "Bei jedem großen Auftrag muss man mit vielen Konkurrenten konkurrieren, POCs für die Kunden - Szenarien durchführen und mehrere Runden von Tests für Zuverlässigkeit, Robustheit und Stabilität bestehen. Nur diejenigen, die diese Tests bestehen, bleiben übrig."

Liu Nianfeng gab bekannt, dass es scheinbar viele Embodied - AI - Firmen gibt, die in Szenarien eingedrungen sind, aber nur wenige, die die Arbeit wirklich gut erledigen können. "Beispielsweise können Roboter in einer Fabrik, wenn es um das Transportieren von Kisten geht, die Kisten nicht erkennen, wenn sich das Licht ändert oder die Kisten in Aussehen und Größe unterschiedlich sind, was zu einem Misserfolg der Aufgabe führt", sagte er.

Diese Fähigkeit, "zu erkennen und zu handeln", stammt von dem Technikteam von Zhongke Fifth Epoch.

Im Bereich der Algorithmen stammen die Kernmitglieder des Teams alle vom Institut für Automatisierung der chinesischen Akademie der Wissenschaften. Neben Liu Nianfeng sind die Mitgründer und Algorithmus - Direktor Liu Jing sowie der junge Chefwissenschaftler Huang Yan alle Doktoranden von Akademiker Tan Tieniu. Sie haben sich tief in die Bereiche der künstlichen Intelligenz und der multimodalen Intelligenz vertieft und haben nach ihrem Abschluss bei Unternehmen wie Microsoft und Huawei gearbeitet. Der Mitgründer Cao Enhua ist Master vom Institut für Automatisierung der chinesischen Akademie der Wissenschaften und war früher Algorithmus - Experte am Alibaba DAMO Academy.

Das selbst entwickelte Embodied - Operations - Large - Model "FAM - Serie" des Teams nutzt die "Doppelte Pre - Training" und die "Heatmap - Alignment", um das Modell bei der Ausführung von Aufgaben stärker auf lokale Schlüsselpunkte zu fokussieren. Beispielsweise wird beim Transport von Kisten eher auf die Griffe geachtet, anstatt sich auf eine große Anzahl von Bildern von Kisten unterschiedlicher Farben und Altersstufen zu verlassen, um das "Aussehen zu merken".

Liu Nianfeng sagte, dass diese Methode es den Robotern ermöglicht, mit nur 3 bis 5 echten Demonstrationsdaten neue Aufgaben zu lernen, und die Erfolgsrate für Grundaufgaben kann bis zu 97 % erreichen.

Die Hardware - Fähigkeiten von Zhongke Fifth Epoch stammen vom Team der Tsinghua - Universität. Der langfristig angestellte Professor Sun Fuchun von der Tsinghua - Universität fungiert als Mitgründer und Chefwissenschaftler von Zhongke Fifth Epoch. Sein Team aus Lehrern und Studenten bietet der Firma Unterstützung bei der Hardware und der Bewegungskontrolle.

Im Folgenden ist die Transkription des Interviews mit Liu Nianfeng. Das Gespräch wurde vom Autor/in bearbeitet:

△ Der zweiachsige Radroboter von Zhongke Fifth Epoch. Foto: Interviewer/in

Von einem "universellen Gehirn" zu einem "Gehirn, das in vertikalen Szenarien tatsächlich arbeitet"

Intelligent Emergence: Was bedeutet es, ein "Kern - Ökosystem - Partner" von Unitree zu sein?

Liu Nianfeng: Als "Kern - Ökosystem - Partner" von Unitree bedeutet es, dass unser Embodied - AI - Modell tief mit der leistungsstarken Roboterplattform von Unitree integriert werden kann. Unitree - Roboter haben in der Bewegungskontrolle und der Hardwareentwicklung führende Vorteile, und die Liefermenge wächst stetig. Als Ökosystem - Partner integrieren wir unser selbst entwickeltes Embodied Brain in die Unitree - Roboter, um ihnen die Fähigkeit zu verleihen, komplexe Aufgaben auszuführen. In diesem Modell können die Roboter schneller in praktische Arbeitsbereiche wie die Industrie und die Inspektion eintreten. Die Massenlieferungen von Unitree fördern auch die Umsetzung unserer Geschäftsideen.

Intelligent Emergence: Es gibt viele Firmen, die Vorteile in der Entwicklung von Embodied - AI - Gehirnen haben. Warum wurde Zhongke Fifth Epoch der Modell - Anbieter von Unitree?

Liu Nianfeng: Bei der Zusammenarbeit mit Unitree mussten wir viele führende Embodied - AI - Firmen besiegen.

Unitree hat sich zuvor mit vielen führenden Gehirn - Firmen und Hochschul - Forschungsinstituten in Kontakt gesetzt, und viele Modelle haben auch gute Fähigkeiten. Die beiden Hauptgründe, warum wir gewonnen haben, sind: Erstens haben wir eine solide Gehirn - Fähigkeit, insbesondere die Fähigkeit, schnell aus einer kleinen Datenmenge zu lernen. Zweitens haben wir die Fähigkeit, schnell zu liefern und umzusetzen, und das Team hat auch reiche Produkt - Erfahrungen.

Intelligent Emergence: Sie sagten, dass Sie Unitree bei der Stromüberprüfung helfen. Aber einige Firmen in der Branche sind bereits in diesem Bereich tätig. Wo liegen Ihre Vorteile oder Unterschiede?

Liu Nianfeng: Die herkömmliche Überprüfung kann nur "sehen". Wenn ein Problem entdeckt wird, muss noch jemand hingeschickt werden, es zu lösen. Unser Ziel ist die Überprüfung plus die Durchführung von Aktionen - wenn der Roboter an einem bestimmten Punkt eintrifft, kann er direkt Aktionen ausführen, wie etwa einen Schlüssel nehmen, eine Schranktür öffnen, einen Schalter drücken oder einen Stecker ziehen.

Bei der herkömmlichen Stromüberprüfung werden Vierbeiner - Roboter verwendet. Aber diese Aktionen erfordern eine menschenähnliche Konfiguration. Bei einem kürzlichen Wettbewerb für intelligente Stromüberprüfung hat unser Roboter strenge Kriterien wie eine 90 % - ige Erfolgsrate bei der Migration zwischen verschiedenen Stationen, weniger als 10 Malige Demonstration für neue Schranktypen und eine Endpunkt - Positionierungsgenauigkeit von ± 15 mm erreicht, was die Umsetzbarkeit bestätigt.

Intelligent Emergence: Könnte man nicht einfach einem Vierbeiner - Roboter Arme hinzufügen, um dieses Problem zu lösen?

Liu Nianfeng: Das geht nicht so gut. Es gibt hauptsächlich zwei Gründe.

Der erste Grund ist, was Elon Musk gesagt hat: Unsere Welt ist für Menschen gemacht. Viele Geräte sind auf die menschliche Größe abgestimmt. Stromgeräte sind auf die menschliche Größe ausgelegt, und es ist für Vierbeiner - Roboter schwierig, an Schaltschränke in einer Höhe von 2 Metern zu gelangen.

Das zweite Problem ist, dass die Kombination von Vierbeiner und zwei Armen eine nicht - standardisierte Konfiguration ist. Ich denke, dass wir als Robotermacher von der Idee einer nicht - standardisierten Konfiguration Abstand nehmen sollten. Denn nicht - standardisiert bedeutet, dass man keine Massenproduktion betreiben kann - heute muss die Armlänge 1,5 Meter betragen, morgen 2 Meter; heute ist die Genauigkeit 0,1 Millimeter, morgen 1 Millimeter - so kann die Produktion nicht wachsen, die Kosten können nicht gesenkt werden, und die Algorithmen können nicht wiederverwendet werden.

Die Branche sollte sich zunächst auf standardisierte Hardware - Konfigurationen "konzentrieren", beispielsweise auf eine Übereinkunft über zumindest die oberen Körperteile mit zwei Armen. Dann sollten die Generalisierungsprobleme für unterschiedliche Belastungen und Taktzeiten gelöst werden, anstatt immer mit neuen Konfigurationen zu arbeiten.

Intelligent Emergence: Ganz gleich, ob es sich um Unitree oder um Endkunden für komplette Roboter handelt, die von Zhongke Fifth Epoch angebotenen Lösungen drehen sich hauptsächlich um die Fähigkeit, in konkrete Szenarien einzudringen. Ist das auch das, was die Investor*innen in dieser Phase akzeptieren?

Liu Nianfeng: Ja, früher strebte die Branche vielleicht ein universelles Modell an, das "Kisten tragen, Tische aufräumen und Kleidung falten" kann.

Aber anstatt einer fernen und ultimativen universellen Intelligenz haben wir immer daran festgehalten, Modelle zu entwickeln, die in vertikalen, konkreten Aufgaben umgesetzt werden können, wie etwa die Lösung des Problems des Kistentransports in einer Fabrik. In diesem Jahr hat auch der Primärmarkt die Wichtigkeit davon erkannt.

Technischer Kern: Kleine Datenmengen, hohe Effizienz der Datennutzung

Intelligent Emergence: Viele Embodied - AI - Firmen, die ich kürzlich interviewt habe, darunter auch Zhongke Fifth Epoch, sagen, dass ihre Roboter in industriellen Szenarien Kisten transportieren. Aber Sie haben erwähnt, dass es nicht viele Unternehmen gibt, die dieses scheinbar einfache Problem wirklich gut lösen können. Was sind also aus Sicht der Modell - Fähigkeiten die Schwierigkeiten beim Kistentransport durch Embodied - Roboter?

Liu Nianfeng: Der Kistentransport scheint eine monoton wiederholende Arbeit zu sein, aber es gibt tatsächlich mehrere Schwierigkeiten.

Erstens die Generalisierung: Kisten können in Farbe, Größe und Alter unterschiedlich sein. Kann man mit demselben Modell die Kisten stabil erkennen, greifen und transportieren? Zweitens die Navigation: Wie soll der Roboter nach dem Greifen der Kiste von Punkt A nach Punkt B gehen? Wie soll er die Route planen, Hindernisse vermeiden und die Aufgabe fortsetzen, wenn er unterbrochen wird? Drittens das Verständnis der Strategie: Beispielsweise, wenn der Befehl lautet, "50 von 100 Kisten vor Ihnen wegzunehmen", kann der Roboter die Anzahl verstehen und die 50 Kisten auswählen? Wie soll er die Kisten am Zielort stapeln und muss er die Gegenstände aus den Kisten nehmen? In jedem Schritt gibt es Probleme.

All das, was auf den ersten Blick wie ein Kistentransport aussieht, ist tatsächlich eine ganze Reihe komplexer Aufgabenplanung und - ausführung.

Intelligent Emergence: Sie haben gerade die Generalisierbarkeit von Kisten erwähnt. Kisten scheinen Gegenstände mit einem relativ einfachen Aussehen zu sein. Warum wird es für das Embodied - AI - Modell schwieriger, sie zu erkennen, wenn sich das Licht ändert?

Liu Nianfeng: Der grundlegende Grund ist, dass das derzeit vorherrschende VLA - Modell in der Embodied AI von den dynamischen Modellen der Large - Language - Modelle abgeleitet ist - es macht eine globale Informationsabbildung des gesamten Bildes.

Nehmen wir zum Beispiel ein Foto von drei Mineralwasserflaschen. Wenn das Licht tagsüber und nachts unterschiedlich ist, ändern sich die Farbtemperatur und die Helligkeit des gesamten Bildes. Das Modell kann die Flaschen dann möglicherweise nicht mehr erkennen.

Das Problem ist, dass die Embodied AI nicht über die gleiche Datenmenge wie die Large - Language - Modelle verfügt, um alle Lichtänderungen abzudecken. Aber wenn man es anders sieht, kann das Modell, wenn es sich auf lokale Informationen konzentriert - beispielsweise nur auf die äußeren Merkmale jeder Flasche und nicht auf den Hintergrund, das Licht oder die Farbe des Tables - von globalen Veränderungen unbeeinträchtigt bleiben. Dies ist der Ausgangspunkt für unsere "Heatmap": Das Modell soll sich auf das zu manipulierende Objekt selbst konzentrieren, nicht auf das gesamte Bild.

Intelligent Emergence: Erklären Sie bitte im Detail, wie das Modell von Zhongke Fifth Epoch die Generalisierbarkeit verbessert?

Liu Nianfeng: Der Kern der Manipulation ist das zu manipulierende Objekt, aber die vorherrschenden Modelle haben sich zu sehr auf globale Informationen konzentriert. Unser Ansatz ist: Durch mehrere zweidimensionale Heatmaps lernt das Modell die Position des zu manipulierenden Objekts adaptiv, so dass es versteht, was das wichtigste Objekt für die aktuelle Aufgabe ist.