Vier Robotermanufakturunternehmen investieren gemeinsam in eine Datengesellschaft: Neues Projekt taucht auf

Die Investoren umfassen Lingchu Intelligence, Qiongche Intelligence, Zhejiang Humanoid und Zhipingfang.

Text | Qiu Xiaofen

Editor | Su Jianxun

Kurzvorstellung

「Zhiyu Jishi」 ist ein Unternehmen, das sich darauf konzentriert, die Datenzugänge und Trainingsinput - Infrastruktur für die Ära des Embodied Intelligence aufzubauen. Seine Kernmission besteht darin, die massiven und ungeordneten Rohdaten aus der physischen Welt präzise in hochwertige Trainingsinput - Daten zu übersetzen, die direkt auf die Erfolgsquote von Roboteraufgaben abzielen.

Teamvorstellung

Yang Zhexuan, der CEO von 「Zhiyu Jishi」, war ein Kernmitglied von PingCAP. Er hat Hintergrundkenntnisse in der Entwicklung von massiv verteilten Systemen und unteren Architekturen und ist auch ein wiederholter Unternehmer, der sich mit der kommerziellen Geschäftstätigkeit mehrerer Unternehmen befasst.

Xu Liangwei, der CTO von 「Zhiyu Jishi」, hat Berufserfahrung bei Tencent und XPeng Robotics. Er ist ein erfahrener Experte für Robotersoftware und - hardware, der die Datenanforderungen von Embodied - Intelligence - Algorithmen gut versteht und auch reichliche Erfahrungen in der Hardware - Implementierung hat.

Zhang Jiye, der COO von 「Zhiyu Jishi」, war früher der Generalmanager einer Huawei - Niederlassung und hat als Ökosystemverantwortlicher bei dem Embodied - Intelligence - Unternehmen 「Qiongche Intelligence」 gearbeitet.

Finanzierungsstand

Das Unternehmen hat eine Angel - Runde mit mehreren Millionen Yuan abgeschlossen. Die Investoren umfassen vier Roboterhersteller, darunter Lingchu Intelligence, Qiongche Intelligence, Zhejiang Humanoid und Zhipingfang (in alphabetischer Reihenfolge).

Produkte und Geschäftstätigkeit

Derzeit plant 「Zhiyu Jishi」, in ganz China Datenakquise - Fabriken für reale Maschinen mit einer Fläche von über 10.000 Quadratmetern aufzubauen. In diesen Fabriken werden über 400 Roboter und über 10 verschiedene heterogene Hardwareformen eingesetzt.

Es wird erwartet, dass bis 2026 mehr als 200 PB heterogener Daten gesammelt werden. Im zweiten Quartal dieses Jahres wird 「Zhiyu Jishi」 von der Produktion von Daten aus realen Maschinen auf den Bereich des Ego - Centric (erster Person) erweitern. Dadurch wird es den Datenzugang für das Nachtraining und Pretraining von Modellen fest kontrollieren können. Über die Datenübersetzungsschicht werden die Rohdaten in hochwertige Korpora verarbeitet, die direkt als Trainingsinput für Modelle verwendet werden können.

△Konzeptbild eines Ego - Centric - Geräts

Bei der Datenproduktion und - verarbeitung hat das Team von 「Zhiyu Jishi」 die Technologiekonzepte und - architekturen aus der Big - Data - Branche in den Bereich des Embodied Intelligence eingeführt und eine automatisierte 「Datenübersetzungsleitung」 aufgebaut, die die 「Müllansammlung」 überwindet. Die Hauptmerkmale sind wie folgt:

①Datenqualitätskontrolle: In der Vergangenheit haben andere Unternehmen bei der Bewältigung von massiven Daten oft traditionelle Stichprobenprüfungen durchgeführt, was dazu führte, dass bis zu 95 % von ineffektivem Rauschen in die Trainingsdatenmengen gelangte. 「Zhiyu Jishi」 hat dagegen eine verteilte Rechenarchitektur und eine elastische Skalierbarkeit eingeführt, um alle multimodalen Daten wie visuelle, Tiefen -, Gelenkpose - und Kraft - Taktil - Daten, die von Robotern gesammelt werden, auf ihre Qualität zu prüfen und die ineffektiven 「Datenblasen」 direkt an der Quelle zu eliminieren.

②Neuaufbau der Datenbasis (heterogenes Lakehouse speziell für Embodied Intelligence): Die Daten aus der realen physischen Welt zeichnen sich natürlicherweise durch hohe Entropie, vielfältige Quellen und Heterogenität sowie eine stark asynchrone Abtastfrequenz (z. B. der Unterschied zwischen 30 Hz für die visuelle Wahrnehmung und 500 Hz für die Gelenksteuerung) aus. Traditionelle einfache Speicherlösungen führen leicht dazu, dass die Daten zu einem 「multimodalen schwarzen Kasten」 werden, der nicht trainiert werden kann.

Deshalb hat 「Zhiyu Jishi」 zuerst die bewährte Data - Lakehouse - Architektur eingeführt und sie tiefgreifend für die spezifischen Bedürfnisse des Embodied Intelligence umgestaltet. Diese Architektur ermöglicht nicht nur die einheitliche Verwaltung von extrem großen unstrukturierten Datenmengen, sondern auch die hochpräzise 「Zeitstempelausrichtung」 von komplexen Dimensionen wie visuellem, Tiefen -, Kraft - Taktil - und Gelenkpose - Daten im Millisekundenbereich, indem sie auf einem selbst entwickelten Datenmotor basiert.

Dieser Schritt überwindet direkt die zeitliche und räumliche Verschiebung zwischen den Modalen und transformiert die chaotischen physischen Aufzeichnungen in hochwertige zeitliche Assets, die von großen Modellen analysiert werden können.

△Schematische Darstellung der Datenleitung

③Datenübersetzung: Dies ist der am wichtigsten 「Verfeinerungsprozess」. Nicht nur die Rauschunterdrückung, die Datenvermehrung und die Neudirektionierung, sondern auch die 「Skill - Atomisierung」 von nicht standardisierten Daten werden durchgeführt. 「Semantische Fragmente」 mit klaren Handlungsabsichten und physikalischen Beschränkungen werden extrahiert, und es werden Versionsnummern und Datenherkunftsnachverfolgung eingerichtet, um die Nachverfolgung der Assets sicherzustellen.

④Intelligente Suche und Zusammenstellung: Um die Fehlbewertung des Marktes, bei der Daten nach Stunden gekauft werden, zu beheben, hat das Team einen selbst entwickelten Suchmotor eingeführt. Mit einer SQL - ähnlichen Methode können Szenarien, Skills und Bewegungselemente in massiven physischen Daten semantisch aufgerufen werden.

Beispielsweise, wenn das Algorithmus - Team eines Kunden bestimmte Trainingsanforderungen stellt, kann der Datenlieferungsexperte von 「Zhiyu Jishi」 anstelle der traditionellen blinden Suche und manuellen Zusammenstellung einfach kurze Codebefehle in das System eingeben (z. B. die genaue Abfrage von Daten für die Aufgabe 「Tasse greifen」 im 「Küchenszenario」 mit einer bestimmten Validierungserfolgsquote von > 95 %). Das System kann dann schnell reagieren, die passenden strukturierten Skill - Ströme zurückrufen und zusammenstellen. Diese Fähigkeit, nicht standardisierte Anforderungen in standardisierte Systembefehle umzuwandeln, verbessert die Lieferungseffizienz und - genauigkeit erheblich.

⑤Standardisierte Verpackung und elastische Lieferung: Nach der Suche und Zusammenstellung werden die extrahierten strukturierten Fragmente automatisch in standardisierte Trainingsdatensätze mit Versionsnummern (z. B. v2.4.0) verpackt, die sofort einsatzbereit sind.

Angesichts der extrem großen Transaktionsmengen von hunderte TB pro Lieferung hat 「Zhiyu Jishi」 ein elastisches Lieferungssystem aufgebaut. Es unterstützt sowohl die direkte Verbindung und autorisierte Nutzung von Cloud - zentrierten Architekturen wie S3 als auch die Lieferung von physischen Datenträgern für Anwendungen mit hohen Datensicherheitsanforderungen. Dieser flexible Asset - Verteilungsmodell ermöglicht nicht nur die automatisierte Lieferung, sondern auch die Überwindung der 「letzten Meile」 zwischen der Datenverfeinerungsfabrik und der Rechenleistungskluster der Kunden.

Durch die Erstellung dieser stark automatisierten 「Datenübersetzungsleitung」 hat 「Zhiyu Jishi」 einen entscheidenden Sprung in der Geschäftsmodellentwicklung erreicht. Obwohl die hochpräzise Datenerfassung aus der physischen Welt weiterhin auf Fachkräften und Fabriken mit realen Maschinen angewiesen ist, hat das System in den Kernbereichen der Datenverarbeitung und massiven Lieferung die Entkopplung von der traditionellen 「Massenarbeit」 vollständig erreicht.

Geschäftsmodell

Um die kommerzielle Implementierung der 「Datenverfeinerungsfabrik」 schrittweise voranzubringen, hat Zhiyu Jishi einen dreistufigen Geschäftsentwicklungspfad geplant, um den Sprung von der Datenproduktion über die Datenverfeinerung bis zur Erstellung der Brancheninfrastruktur zu erreichen:

Erste Stufe (2026 - 2027): Das Kernziel besteht darin, den Zugang zu hochwertigen physischen Daten zu sichern. In Anlehnung an die EgoScale - Strategie von NVIDIA entwickelt das Unternehmen eigene Ego - Centric (erster Person) - Tragegeräte, um seltene Pretraining - Korpora zu erhalten. Gleichzeitig baut es in Zusammenarbeit mit Behörden, Unternehmen und führenden Roboterherstellern Fabriken für die Datenerfassung mit realen Maschinen auf, um Nachtrainings - Industriedaten zu sammeln. Derzeit hat das Unternehmen bereits Bestellungen im Wert von fast einer Million Yuan aufgrund der Bereitstellung von maßgeschneiderten strukturierten Trainingsinput für führende Kunden.

Zweite Stufe (2027 - 2029): Mit der Reifung der Kernleitung wird sich das Geschäftsmodell von der 「Datenproduktion und - verfeinerung」 auf das 「Abonnement von standardisierten Assets」 verlagern. Die zuvor gesammelten allgemeinen Handlungen und Szenarien werden zu sofort einsatzbereiten Branchenstandarddatensätzen verarbeitet. Durch langfristige Rahmenvereinbarungen und die Aktualisierung des Szenarienarchivs wird die wiederholte Monetarisierung einzelner Datenassets ermöglicht, was die Gewinnspanne erheblich erhöht und eine breitere Kundengruppe abdeckt.

Dritte Stufe (ab 2029): Die Öffnung der API und die Schaffung einer Entwicklerökosystem werden die Grundlage für die Erstellung einer allgemeinen Infrastruktur für Embodied - Intelligence - Daten. Ein Datenmarkt und eine Entwicklerökosystem werden aufgebaut, um schließlich die skalierte Verteilung und die Wiederverwendung von Datenassets im gesamten Ökosystem zu ermöglichen.

Denken des Gründers

①Es besteht ein Kernwiderspruch in den Embodied - Intelligence - Daten

Nach Ansicht von Yang Zhexuan, dem CEO von 「Zhiyu Jishi」, steht die aktuelle Embodied - Intelligence - Branche vor einer verborgenen 「Versorgungskrise」: Die Branche hat enorme Trainingsanforderungen und es fehlen nicht an massiven Rohdaten, aber es fehlt an der Infrastrukturfähigkeit, die chaotischen physischen Aufzeichnungen stabil und effizient in Trainingsinput mit hohem Signal - Rausch - Verhältnis zu 「übersetzen」. Viele multimodale Erfassungsaufzeichnungen, die nicht tiefgehend strukturiert wurden, werden oft zu 「Datenmüll」, der die Rechenleistung von Modellen verschwendet.

Der zugrunde liegende Widerspruch dieser Erscheinung liegt darin, dass die Verarbeitung von Embodied - Intelligence - Daten natürlich in einem 「Lückenbereich zwischen verschiedenen Fachgebieten」 liegt. Derzeit verstehen zwar die Roboteralgorithmus - Teams die feinen Anforderungen von Modellen an physikalische Gesetze, Handlungsbeschränkungen und Aufgabensemantik gut, aber sie sind oft an technischen Engpässen gebunden und können keine industrietauglichen großen Datenpipeline aufbauen. Andererseits haben traditionelle AI - Datenbeschriftungsunternehmen zwar Erfahrung in der massiven Produktion, die auf Arbeitskräfteintensität basiert, aber aufgrund des Mangels an Kenntnissen über die unterliegenden Logiken von Roboterkinesik, Kraft - Taktil - Rückmeldung und multimodaler Zeitraumausrichtung ist die Qualität ihrer Produkte oft nicht ausreichend, um den strengen Standards von großen Modellen für reale Szenarien zu entsprechen.

Mit dem exponentiellen Anstieg der Datenmenge in der Embodied - Intelligence - Branche wird diese strukturelle Verschiebung, dass 「diejenigen, die Algorithmen verstehen, die industrielle Massenproduktion nicht verstehen, und diejenigen, die Massenproduktion verstehen, die Roboterhardware nicht verstehen」, nicht nur die Fehlertoleranzkosten der Branche erhöhen, sondern auch der größte Hemmschuh für den Sprung von großen Embodied - Modellen über die physische Kluft werden.

②Eine arbeitsintensive Datenerfassungfabrik hat keine Wettbewerbsvorteile

Um in der Embodied - Intelligence - Datenbranche echte kommerzielle Wettbewerbsvorteile zu schaffen und eine skalierte Profitabilität zu erreichen, reicht es nicht aus, sich einfach auf die traditionelle arbeitsintensive Managementoptimierung zu verlassen. Stattdessen muss die Gesamtkosten der Datenverarbeitung systematisch gesenkt werden, indem die technische Architektur neu strukturiert wird.

Yang Zhexuan, der CEO von 「Zhiyu Jishi」, hat darauf hingewiesen, dass die Arbeitskosten von Natur aus starr sind und dass die Managementeffizienz mit der Unternehmensgröße zwangsläufig an ihre Grenzen stößt. Angesichts der zunehmend großen PB - Datenmenge, die von großen Modellen verarbeitet werden muss, kann das traditionelle Modell, das auf der 「Anzahl von Arbeitskräften」 basiert, keine langfristige Kernkompetenz bilden. Die echte kommerzielle Lösung besteht darin, die Skalierung des Verarbeitungsprozesses mithilfe einer hochautomatisierten 「Datenleitung」 zu erreichen. Dies ist der beste Weg, um die Fixkosten zu senken und die Grenzerträge zu erhöhen.

Unter realistischen Annahmen kann die Arbeitskräfteanforderung von 「Zhiyu Jishi」 in den Kernbereichen der Datenverarbeitung in Zukunft um mindestens 50 % reduziert werden. Yang Zhexuan ist der Meinung, dass die effektive Entkopplung der Datenproduktion und der Arbeitskräfteeinsatz durch harten technischen Ansatz der Grundstein für ein Unternehmen ist, das sich zu einer Infrastruktur mit hoher Gewinnspanne entwickelt.

③Das Jahr 2026 ist ein entscheidender Prüfpunkt für den Sprung von Embodied Intelligence über die kommerzielle Kluft

Seit 2023 hat es eine Welle von Investitionen in Roboter, Modelle und Komponenten gegeben. Der Engpass bei der Umsetzung von Embodied Intelligence ist inzwischen allgemein anerkannt: 「Daten sind der Engpass」. Yang Zhexuan schätzt, dass im Jahr 2026, wenn sich die Start - up - Unternehmen in der Datenbranche wie Pilze aus dem Boden schießen, die Datenmenge in der Embodied - Intelligence - Branche um mehrere Zehnerpotenzen steigen wird und auf das Niveau von Millionen von Stunden ansteigen wird.

Deshalb sind die nächsten zwei Jahre ein entscheidender Prüfpunkt: Wenn nach der erheblichen Linderung des Datenmengenproblems die Erfolgsquote und die Generalisierungsfähigkeit von großen Modellen in realen Szenarien immer noch keine wesentlichen Fortschritte machen können, wird die gesamte Branche einer schwerwiegenden Neubewertung des Vertrauens und einer Existenzprüfung ausgesetzt sein.

Der Schlüssel zum Überwinden dieses Punktes besteht nicht mehr in der groben Datensammlung, sondern darin, wie die