StartseiteArtikel

Jijia Shijie hat eine Serie Pre - B - Finanzierung in Höhe von 1 Milliarde Yuan abgeschlossen. Das "Weltmodell" treibt die allgemeinen Roboter an, sich beschleunigt in alle Branchen einzuschleichen.

36氪品牌2026-03-05 21:40
Das "OpenAI" der physischen Zielwelt.

Nur zwei Monate nach der Ankündigung der letzten Finanzierungsrunde hat das Unternehmen für Embodied Intelligence, "Jijia Vision", kürzlich eine neue, bedeutende Finanzierungsrunde erhalten.

Es ist bekannt, dass diese Runde eine Pre-B-Runde mit einem Betrag von fast einer Milliarde Yuan ist. Die Investoren dieser Runde umfassen Chip- und Automobilbranchenkapitalgeber wie Zhongxin Juyuan, Shanghai Semiconductor Industry Investment Fund, Linxin Capital, Xingyuan Capital, Wanlin International sowie staatliche Kapitalplattformen und Finanzinvestitionsinstitute wie CICC Capital, Suzhou Venture Capital, Huaqiang Capital, Yangtze River Capital, Optics Valley Industry Investment, Xishan State-owned Investment, Jinyu Maowu, Xinding Capital, Lingyang Investment, Caixin Capital, Zhangke Yaokun und Chengzhu Investment.

Unter ihnen haben Institutionen wie CICC Capital, Huaqiang Capital, Caixin Capital und Zhangke Yaokun als alte Aktionäre weiterhin übermäßig investiert.

Der Grund, warum verschiedene bekannte Investoren aus der Industrie-, Finanz- und Staatssektor in Jijia Vision investieren, liegt in der Anerkennung der Richtung des von dem Unternehmen verfolgten "Weltmodells".

Als eines der führenden chinesischen Unternehmen für "Embodied Basismodelle und allgemeine Roboter" hat Jijia Vision eine Vier-in-Eins-Strategie von "Embodied Basismodell - Weltmodell - Ursprungsobjekt - Generalisierte Szenarien" eingeführt.

Die GigaBrain-Serie von Embodied Basismodellen ist die Kernbasis der Technologie und Produkte von Jijia Vision. Das Open-Source-Modell GigaBrain-0.1 des Unternehmens hat auch im weltweit größten echten Maschinen-Testwettbewerb RoboChallenge viele Modelle wie Pi0.5 übertroffen und den ersten Platz gewonnen.

Zugleich ist Jijia Vision auch das erste chinesische Unternehmen, das sich auf Weltmodelle konzentriert hat. Es hat GigaWorld-policy veröffentlicht und erstmals weltweit einen umfassenden Durchbruch bei der Echtzeitfähigkeit, TrainingsEffizienz und Erfolgsrate des "Aktion - Weltmodell WA" erzielt.

Im Gegensatz zu früheren Fokus auf technologische Durchbrüche ist das Schlüsselwort von Jijia Vision im Jahr 2026 "Generalisierte Szenarien Umsetzung". Von der Massenproduktion und Lieferung des Objekts bis hin zu den Kundenaufträgen bringen die Technologien und Produkte von Jijia Vision die reale Welt tatsächlich veränderungen.

"Embodied Basismodelle" führen voraus, "Weltmodelle" überwinden die Effizienzengpässe

Zurzeit ist die Sprachmodellierung dabei, die gesamte digitale Welt neu zu gestalten. Dennoch findet etwa 50 % des globalen BIP in der physischen Welt statt - ein Raum, der noch auf die Revolution durch KI wartet.

Aus der Perspektive des Finanzierungsfortschritts wird das Potenzial von Jijia Vision, "physikalische AGI" zu erreichen, von den Investoren anerkannt. Die Grundlage für die Verwirklichung dieses Visions ist die kontinuierliche Verbesserung der Fähigkeiten der Embodied Basismodelle von Jijia Vision.

Die GigaBrain-Serie von Basismodellen dient als Embodied Roboterhirn, das von Jijia Vision entwickelt wurde, und bietet eine Ende-zu-Ende-Entscheidungssteuerung. Über die VLA-Modellarchitektur unterstützt diese Serie die Eingabe von Bildern, Tiefeninformationen, Texten und Objektzuständen und gibt strukturierte Aufgaben- und Bewegungspläne aus.

Derzeit hat Jijia Vision den Technologiebericht zu GigaBrain-0 veröffentlicht und die Basismodelle GigaBrain-0 und GigaBrain-0.1 Open-Source gemacht, was weltweit führende Ergebnisse bei echten Maschinen für lange und komplexe Aufgaben erzielt hat. Das Open-Source-Modell GigaBrain-0.1 hat im Embodied Echtmaschinen-Benchmark "RoboChallenge" den ersten Platz gewonnen.

Obwohl VLA im vergangenen Jahr zum Hauptparadigma im Bereich der Embodied Intelligence geworden ist, werden seine Einschränkungen immer deutlicher.

"Wir müssen erkennen, dass es bei den derzeit von VLA dominierten Embodied Basismodellen zwei Schlüsselprobleme gibt: Erstens ist die Effizienz der Modellarchitektur zu niedrig, und zweitens ist die Effizienz der echten Datenerfassung zu niedrig", sagte Huang Guan, Gründer und CEO von Jijia Vision.

Das Weltmodell ist genau der Durchbruch, den Jijia Vision für diese beiden Probleme gefunden hat.

Als das erste chinesische Unternehmen, das sich auf Weltmodelle konzentriert hat, hat Jijia Vision in den beiden Ebenen "Datenmotor" und "Modellarchitektur" führende Ergebnisse erzielt.

Beim Datenmotor hat Jijia Vision kontinuierlich den technologischen Durchbruch und die industrielle Umsetzung von Embodied- und Fahr-Weltmodell-Simulatoren vorangetrieben.

Im Bereich der Embodied-Intelligenz hat GigaWorld-0 erstmals weltweit den Kernwert des Embodied Weltmodells auf einem hochwertigen Embodied Basismodell entfaltet; GigaWorld-0.5, als Basismodell von GigaWorld-Policy, hat sowohl die Effizienz als auch die Wirkung verbessert.

Im Bereich des Fahrens sind die Arbeiten der Serie DriveDreamer, DriveDreamer4D usw. eine der weltweit ersten bahnbrechenden Forschungen, die Weltmodelle in die physische Welt anwenden, und es hat bereits eine umfangreiche industrielle Umsetzung begonnen.

Bezüglich der Modellarchitektur ist GigaBrain-0.5M* das weltweit erste Embodied Basismodell, das auf der Grundlage eines Weltmodells eine selbständige Evolution durch Reinforcement Learning erreicht.

Und gleichzeitig mit der Ankündigung dieser Finanzierungsrunde hat Jijia Vision einen technologischen Meilenstein erreicht - GigaWorld-Policy ist offiziell vorgestellt worden.

△GigaWorld-Policy, Bild: Artikel-Screenshot

Dies ist eine Kerntechnologie, die den "Gehirn" eines Roboters intelligenter und reaktionsschneller macht.

In der herkömmlichen Methode muss ein Roboter zuerst die zukünftigen Bilder vorhersagen, bevor er entscheidet, wie er handeln soll. Dieser Prozess ist langsam und mit hohem Rechenaufwand verbunden. GigaWorld-Policy ändert diese Logik: Es lernt in der Trainingsphase, "welche Bilder eine Aktion verursacht", gibt aber in der praktischen Arbeit direkt die Aktion aus und überspringt die Bildvorhersagephase. Dadurch wird die Denkgeschwindigkeit des Roboters um das Zehnfache erhöht, und die Erfolgsrate der Aufgaben steigt um etwa 30 %.

Noch wichtiger ist, dass dieses Verfahren den Bedarf an echten Daten erheblich reduziert. Es lernt zuerst über eine Vielzahl von Internetvideos die grundlegenden Gesetze der physischen Welt und passt sich dann schnell an spezifische Aufgaben an, indem es eine kleine Menge an Roboterbedienungsdaten kombiniert. Die gesamte TrainingsEffizienz wird um das Zehnfache verbessert.

Das bedeutet, dass Roboter neue Fähigkeiten mit geringeren Kosten und höherer Geschwindigkeit erlernen können, was ein wichtiges Hindernis für die Massenkommerzialisierung beseitigt.

Derzeit hat GigaWorld-Policy in typischen Aufgaben wie Greifen, Montieren und Ordnen eine durchschnittliche Erfolgsrate von 85 % erreicht, was weit über den gängigen Modellen liegt, und kann gleichzeitig eine hohe Erfolgsrate und Echtzeitreaktion gewährleisten. Es macht es möglich, dass Weltmodelle aus dem Labor in die reale Welt gelangen und bietet einen praktisch einsetzbaren "Gehirn" für Roboter, die in Fabriken, Lagern und Haushalten eingesetzt werden können.

△GigaWorld-Policy hat in typischen Aufgaben wie Greifen, Montieren und Ordnen eine durchschnittliche Erfolgsrate von 85 % erreicht, was über den gängigen Modellen liegt, Bild: Unternehmen bereitgestellt

Von Modellen zu Robotern - Embodied Intelligence tritt in die reale Welt ein

Ob es sich um die starken Basismodellfähigkeiten oder die Effizienzsteigerung der Weltmodelle handelt, die technologischen Leistungen der Embodied Intelligence müssen schließlich in realen Szenarien validiert werden.

Das ultimative Ziel des technologischen Durchbruchs ist der Übergang in die reale Welt. Im vergangenen Jahr hat Jijia Vision begonnen, diese Modellfähigkeiten in die Roboterobjekte zu integrieren - denn auch das intelligenteste "Gehirn" braucht eine handlungsfähige Hand.

Im November 2025 hat Jijia Vision den eigenentwickelten physischen AGI-Ursprungsobjekt Maker H01 vorgestellt, was die "Hardware-Software-Integration" Fähigkeiten des Unternehmens zeigt. Noch wichtiger ist, dass Maker H01 nicht nur ein Ausführungsterminal ist, sondern auch ein "Datenportal" für die Modellentwicklung - jede Bedienung jedes Roboters in der realen Welt erzeugt wertvolle Echtmaschinendaten, die die GigaBrain-Basismodelle verbessern und einen positiven Kreislauf von "Je mehr Verwendung, desto intelligenter" bilden.

Am 31. Januar 2026 hat Maker H01 die erste Lieferung offiziell begonnen, was den Sprung von Jijia Vision von einem Modellunternehmen zu einem "Modell + Hardware" Zwei-Rad-Antrieb markiert. Das Unternehmen plant, im gesamten Jahr mehrere Ursprungsobjekte für verschiedene Szenarien zu veröffentlichen und sich an die Lieferung von tausend Einheiten zu wagen. Dieses Team, das in der Vergangenheit die Massenproduktion von tausenden humanoiden Robotern geleitet hat, wandelt die Modellvorteile in skalierbare Produkte um.

MakerH01 ist für industrielle und Dienstleistungsszenarien konzipiert und verwendet eine Kombination aus zweiaarmiger Struktur und mobiler Plattform, um grundlegende Bedienungsaufgaben wie Greifen und Transport auszuführen. Gleichzeitig übernimmt dieser Roboter auch die Aufgaben der Datenerfassung und des Modelltrainings und liefert echte Bedienungsdaten für die kontinuierliche Verbesserung der Embodied Modelle.

△Arbeitsansicht des Roboters Maker H01, Bild: Unternehmen bereitgestellt

Bis jetzt hat Jijia Vision mehrere Kunden gewonnen, darunter Automobilhersteller und Roboterunternehmen aus China und dem Ausland sowie Unternehmen aus der industriellen Fertigung und Dienstleistungsbranche. Die Anwendungsbereiche umfassen Automobilherstellung, 3C-Elektronik, Lagerlogistik, kommerzielle Dienstleistungen und Haushaltsgeräte.

Im industriellen Bereich werden Roboter hauptsächlich für Transport, Montage und Datenerfassung eingesetzt. Im Dienstleistungsbereich sucht das Unternehmen auch nach neuen Anwendungsbereichen, wie z. B. intelligente Führung und interaktive Präsentationen. Diese Szenarien stellen neue Anforderungen an die Interaktionsfähigkeit der Roboter und bieten der Embodied Intelligence-Technologie mehr Chancen für die praktische Anwendung.

Zugleich ist Jijia Vision auch dabei, das Embodied Intelligence-Datensystem aufzubauen. Das Unternehmen arbeitet mit dem Hubei Humanoid Robot Innovation Center zusammen, um eine Datenfabrik mit realer und virtueller Kombination aufzubauen. Durch die Kombination von realen Szenariodaten, Simulationsumgebungen und Roboterbedienungsdaten wird kontinuierlich Trainingsdaten für die Embodied Basismodelle bereitgestellt.

Nach Ansicht von Jijia Vision hängt die Entwicklung der Embodied Intelligence von einem Kreislaufmechanismus von "Szenario - Daten - Modell" ab: Reale Szenarien erzeugen Bedienungsdaten, die Daten verbessern das Modelltraining, und die Modellfähigkeiten treten dann in neue Anwendungsbereiche ein.

Deshalb ist der Roboterobjekt nicht nur eine Produktform, sondern auch eine wichtige Datenquelle für die kontinuierliche Verbesserung des Modells. Mit der ständigen Verstärkung des obigen Kreislaufs wird die Fähigkeit der Roboter in der realen Welt auch kontinuierlich verbessert und sich allmählich der "physikalischen AGI" nähern.

Von der Laborarbeit zur industriellen Front - Strebung nach physischer AGI

Die verschiedenen Forschungsergebnisse von Jijia Vision basieren auf seinem Kernteam - dem Intelligenten Visuallabor der Fakultät für Automatisierung der Tsinghua-Universität.

Huang Guan, Gründer und CEO des Unternehmens, ist ein Innovationsführender Ingenieur-Doktor der Fakultät für Automatisierung der Tsinghua-Universität. Er war früher Leiter der visuellen Wahrnehmungstechnologie von Horizon Robotics und arbeitete auch in Instituten wie dem Microsoft Research Asia und dem Samsung China Research Institute.

Dr. Huang Guan hat die technologische und industrielle Entwicklung der physischen KI in den letzten zehn Jahren vollständig erlebt. Er hat mehrmals Teams geführt, die Weltmeisterschaften in global anerkannten KI-Wettbewerben gewonnen haben, und mehrere weltweit bekannte KI-Ergebnisse veröffentlicht. In der Richtung der physischen KI hat Huang Guan reiche Erfahrungen in technologischer Innovation, industrieller Umsetzung und kontinuierlichem Unternehmertum.

Das Kernteam von Jijia Vision ist eines der ersten chinesischen Teams, das die Entwicklung von End-to-End-Modellen für die physische Welt begonnen hat. Es hat kontinuierlich den technologischen Durchbruch und die industrielle Umsetzung von physischen KI-Algorithmen wie Objekterkennung, Gesichtserkennung, BEV, OCC, End-to-End und Weltmodellen vorangetrieben.

In der Richtung der weltklasse physischen KI-Basismodelle gehören die Teammitglieder ehemalige Vizepräsidenten und Architekturexperten großer Internetunternehmen, Weltklassewissenschaftler mit fast 20.000 Zitierungen, Weltmodellwissenschaftler mit über 10 ersten Autorinnen in Top-Konferenzen, Branchenexperten mit über 10 Jahren Erfahrung in der Massenproduktion von physischer KI, Huawei-Genius-Jugendliche und Algorithmus- und Infrastruktur-Experten für die lineare Beschleunigung von Tausenden von Grafikkarten zu.

In der Richtung der Entwicklung von humanoiden Objekten hat Jijia Vision die Forschungsleiter von chinesischen Spitzenunternehmen für Roboter mit ho