Jijia Vision hat eine Serie Pre-B Finanzierung in Höhe von 1 Milliarde Yuan abgeschlossen. Die "Weltmodell"-Technologie treibt die allgemeinen Roboter an, um beschleunigt in alle Branchen einzudringen.
Nur zwei Monate nach der Ankündigung der letzten Finanzierungsrunde hat das Unternehmen für Embodied Intelligence, "Jijia Vision", kürzlich eine weitere bedeutende Finanzierungsrunde erhalten.
Es ist bekannt, dass diese Runde eine Pre-B-Runde mit einem Betrag von fast einer Milliarde Yuan ist. Die Investoren dieser Runde umfassen Chip- und Automobilindustrie-Kapitalgeber wie Zhongxin Juyuan, Shanghai Semiconductor Industry Investment Fund, Linxin Capital, Xingyuan Capital, Wanlin International, sowie staatliche Kapitalplattformen und Finanzinvestitionsinstitute wie CICC Capital, Suzhou Venture Capital Group, Huaqiang Capital, Yangtze River Capital, Optics Valley Industry Investment, Xishan State-owned Investment, Jinyu Maowu, Xinding Capital, Lingyang Investment, Caixin Capital, Zhangke Yaokun und Chengzhu Investment.
Unter ihnen haben Institutionen wie CICC Capital, Huaqiang Capital, Caixin Capital und Zhangke Yaokun als alte Aktionäre weiterhin überdurchschnittlich hohe Investitionen getätigt.
Der Grund, warum verschiedene bekannte Investoren aus der Industrie-, Finanz- und Staatssektor in Jijia Vision investieren, liegt in der Anerkennung der von dem Unternehmen verfolgten Richtung des "Weltmodells".
Als eines der führenden chinesischen Unternehmen in der Branche der "Embodied Basismodelle und universellen Roboter" hat Jijia Vision eine Vier-in-eins-Strategie von "Embodied Basismodell - Weltmodell - ursprünglicher Roboter - generalisierte Szenarien" entwickelt.
Die GigaBrain-Serie von Embodied Basismodellen ist die Kernbasis der Technologie und Produkte von Jijia Vision. Das Open-Source-Modell GigaBrain-0.1 des Unternehmens hat in der weltweit größten echten Robotertestmeisterschaft, der RoboChallenge, zahlreiche Modelle wie Pi0.5 übertroffen und den ersten Platz belegt.
Zugleich ist Jijia Vision auch das erste chinesische Unternehmen, das sich auf Weltmodelle konzentriert hat. Es hat das GigaWorld-Policy veröffentlicht und weltweit erstmals einen umfassenden Durchbruch bei der "Aktion - Weltmodell WA" in Bezug auf Echtzeitfähigkeit, Trainings-effizienz und Erfolgsrate erzielt.
Im Gegensatz zu früheren Jahren, in denen der Schwerpunkt auf technologischen Durchbrüchen lag, ist das Schlüsselwort für Jijia Vision im Jahr 2026 "Einsatz in generalisierten Szenarien". Von der Massenproduktion und Lieferung von Robotern bis hin zu Verträgen mit Kunden verändern die Technologien und Produkte von Jijia Vision die physische Welt tatsächlich.
"Embodied Basismodelle" im Vorfeld, "Weltmodelle" überwinden Effizienzengpässe
Zurzeit ist die Sprachmodellierung dabei, die digitale Welt zu transformieren. Dennoch wird immer noch etwa 50 % des globalen BIP in der physischen Welt generiert - ein Bereich, der noch auf die Transformation durch KI wartet.
Aus der Perspektive der Finanzierungsentwicklung wird das Potenzial von Jijia Vision für die Realisierung von "physikalischer AGI" von den Investoren anerkannt. Die Grundlage für die Verwirklichung dieses Ziels ist die kontinuierliche Verbesserung der Fähigkeiten der Embodied Basismodelle von Jijia Vision.
Die GigaBrain-Serie von Basismodellen dient als Embodied Roboterhirn, das von Jijia Vision entwickelt wurde, und bietet eine Ende-zu-Ende-Entscheidungssteuerung. Über die VLA-Modellarchitektur unterstützt diese Serie die Eingabe von Bildern, Tiefeninformationen, Texten und Zuständen des Roboters und gibt strukturierte Aufgaben- und Bewegungspläne aus.
Zurzeit hat Jijia Vision den Technologiebericht zu GigaBrain-0 veröffentlicht und die Basismodelle GigaBrain-0 und GigaBrain-0.1 als Open-Source-Projekte freigegeben, was weltweit führende Ergebnisse bei der Lösung langfristiger und komplexer Aufgaben mit echten Robotern erzielt hat. Darunter hat das Open-Source-Modell GigaBrain-0.1 in der Embodied Roboter-Benchmark "RoboChallenge" den ersten Platz belegt.
Obwohl VLA in den letzten Jahren zum vorherrschenden Paradigma in der Embodied Intelligence geworden ist, werden seine Grenzen immer deutlicher.
"Wir müssen erkennen, dass es derzeit zwei kritische Probleme bei den von VLA dominierten Embodied Basismodellen gibt: Einerseits ist die Effizienz der Modellarchitektur zu niedrig, andererseits ist die Effizienz der Datenerfassung in der Realität zu gering", sagte Huang Guan, Gründer und CEO von Jijia Vision.
Das Weltmodell ist genau der Durchbruch, den Jijia Vision für diese beiden Probleme gefunden hat.
Als das erste chinesische Unternehmen, das sich auf Weltmodelle konzentriert hat, hat Jijia Vision in beiden Bereichen des "Daten-engines" und der "Modellarchitektur" führende Ergebnisse erzielt.
Im Bereich der Daten-engines hat Jijia Vision kontinuierlich technologische Durchbrüche und die industrielle Umsetzung von Simulatoren für Embodied- und Fahr-Weltmodellen vorangetrieben.
Im Bereich der Embodied-Technologie hat GigaWorld-0 erstmals weltweit den Kernwert des Embodied Weltmodells auf einem hochwertigen Embodied Basismodell hervorgebracht. GigaWorld-0.5, als Basis-Modell von GigaWorld-Policy, hat sowohl die Effizienz als auch die Effektivität verbessert.
Im Bereich der Fahrtechnologie sind die Arbeiten der DriveDreamer-, DriveDreamer4D-Serie und andere weltweit eine der ersten bahnbrechenden Forschungen, die Weltmodelle in die physische Welt anwenden, und haben bereits eine breite industrielle Umsetzung erfahren.
Im Bereich der Modellarchitektur ist GigaBrain-0.5M* das weltweit erste Embodied Basismodell, das sich auf der Grundlage eines Weltmodells durch verstärktes Lernen selbst verbessern kann.
Genau gleichzeitig mit der Ankündigung dieser Finanzierungsrunde hat Jijia Vision einen bahnbrechenden technologischen Durchbruch erzielt - das GigaWorld-Policy ist offiziell vorgestellt worden.
△GigaWorld-Policy, Bild: Artikel-Screenshot
Dies ist eine Kerntechnologie, die den "Gedankenprozess" von Robotern schärfer und ihre Reaktionsgeschwindigkeit erhöht.
In herkömmlichen Methoden müssen Roboter zuerst zukünftige Bilder vorhersagen, bevor sie entscheiden können, wie sie handeln sollen. Dieser Prozess ist langsam und mit hohem Rechenaufwand verbunden. GigaWorld-Policy ändert diese Logik: Es lernt während der Trainingsphase, "welche Bilder eine Aktion hervorruft", gibt aber bei der tatsächlichen Arbeit direkt die Aktion aus und überspringt somit die Bildvorhersagephase. Dadurch wird die Denkgeschwindigkeit der Roboter um das Zehnfache erhöht, und die Erfolgsrate der Aufgaben steigt um etwa 30 %.
Was noch wichtiger ist, ist dass dieses System den Bedarf an echten Daten erheblich reduziert. Es lernt zunächst die grundlegenden Regeln der physischen Welt aus einer großen Anzahl von Internetvideos und passt sich dann schnell an konkrete Aufgaben anhand einer geringen Menge an Roboterbetriebsdaten an. Insgesamt wird die Trainings-effizienz um das Zehnfache verbessert.
Das bedeutet, dass Roboter neue Fähigkeiten mit geringeren Kosten und höherer Geschwindigkeit erlernen können, was ein wichtiges Hindernis für die breite kommerzielle Nutzung beseitigt.
Zurzeit hat GigaWorld-Policy in typischen Aufgaben wie Greifen, Montieren und Ordnen eine durchschnittliche Erfolgsrate von 85 % erreicht, weit über den gängigen Modellen. Es kann gleichzeitig eine hohe Erfolgsrate und Echtzeitantwort gewährleisten. Dies macht es möglich, dass Weltmodelle aus dem Labor in die reale Welt gelangen und liefert Roboter in Fabriken, Lagerhäusern und Haushalten einen praktikablen "Gedankenprozess".
△GigaWorld-Policy hat in typischen Aufgaben wie Greifen, Montieren und Ordnen eine durchschnittliche Erfolgsrate von 85 % erreicht, höher als die gängigen Modelle. Bild: Unternehmen
Von den Modellen zu den Robotern: Embodied Intelligence tritt in die reale Welt ein
Obwohl die Fähigkeiten der Basismodelle oder die Effizienzsteigerung der Weltmodelle beeindruckend sind, muss die Leistung der Embodied Intelligence schließlich in realen Szenarien validiert werden.
Das ultimative Ziel technologischer Durchbrüche ist der Einsatz in der realen Welt. Im vergangenen Jahr hat Jijia Vision begonnen, die Fähigkeiten dieser Modelle in die Roboter einzubauen - denn auch ein intelligenter "Gedankenprozess" braucht eine handlungsfähige "Hand".
Im November 2025 hat Jijia Vision den vollkommen eigenentwickelten physischen AGI-Roboter Maker H01 vorgestellt, der die "Hardware-Software-Integration" Fähigkeiten des Unternehmens demonstriert. Noch wichtiger ist, dass der Maker H01 nicht nur ein Ausführungsendgerät ist, sondern auch ein "Daten-Eingang" für die Verbesserung der Modelle: Jede Aktion eines Roboters in der realen Welt generiert wertvolle echte Roboter-Daten, die die Iteration des GigaBrain-Basismodells unterstützen und einen positiven Kreislauf von "je mehr genutzt, desto intelligenter" schaffen.
Am 31. Januar 2026 hat die erste Lieferung des Maker H01 begonnen, was den Sprung von einem reinen Modellunternehmen zu einem Unternehmen mit "Modell + Hardware" markiert. Das Unternehmen plant, im gesamten Jahr mehrere Roboter für verschiedene Anwendungsbereiche vorzustellen und eine Liefermenge von tausenden Einheiten zu erreichen. Das Team, das bereits die Massenproduktion von tausenden menschlichenoidalen Robotern geleitet hat, wandelt die Vorteile der Modelle in skalierbare Produkte um.
Der Maker H01 ist für industrielle und dienstleistungsmäßige Anwendungen konzipiert. Mit seiner zweiarmigen Struktur und einem mobilen Fahrwerk kann er grundlegende Aufgaben wie Greifen und Transport ausführen. Zugleich übernimmt der Roboter auch die Aufgabe der Datenerfassung und des Modelltrainings, um echte Betriebsdaten für die kontinuierliche Verbesserung des Embodied Basismodells bereitzustellen.
△Arbeitsansicht des Maker H01-Roboters. Bild: Unternehmen
Bis jetzt hat Jijia Vision Verträge mit mehreren Kunden abgeschlossen. Zu den Geschäftspartnern gehören chinesische und ausländische Automobilhersteller, Robotermanufakturunternehmen sowie Unternehmen aus der industriellen Fertigung und Dienstleistungsbranche. Die Anwendungsbereiche umfassen Automobilherstellung, 3C-Elektronik, Lagerlogistik, gewerbliche Dienstleistungen und Haushaltsgeräte.
Im industriellen Bereich werden die Roboter hauptsächlich für Transport, Montage und Datenerfassung eingesetzt. Im Dienstleistungsbereich sucht das Unternehmen auch nach neuen Anwendungsbereichen, wie z. B. intelligenten Führungen und interaktiven Präsentationen. Diese Szenarien stellen neue Anforderungen an die Interaktionsfähigkeit der Roboter und bieten der Embodied Intelligence-Technologie mehr Möglichkeiten für die praktische Anwendung.
Zugleich fördert Jijia Vision die Aufbau eines Daten-Systems für Embodied Intelligence. Das Unternehmen arbeitet mit dem Hubei Innovation Center für menschlicheoidale Roboter zusammen, um eine virtuelle und reale kombinierte Datenfabrik aufzubauen. Durch die Kombination von echten Szenariodaten, Simulationsumgebungen und Roboterbetriebsdaten liefert diese Fabrik kontinuierliche Trainingsdaten für das Embodied Basismodell.
Nach Ansicht von Jijia Vision hängt die Entwicklung der Embodied Intelligence von einem Kreislaufsystem von "Szenario - Daten - Modell" ab: Reale Szenarien generieren Betriebsdaten, die wiederum die Modellbildung unterstützen, und die Fähigkeiten der Modelle werden dann in neue Anwendungsbereiche eingesetzt.
Deshalb ist der Roboter nicht nur ein Produkt, sondern auch eine wichtige Datenquelle für die kontinuierliche Verbesserung der Modelle. Mit der Verstärkung dieses Kreislaufs wird die Fähigkeit der Roboter in der realen Welt kontinuierlich verbessert und sich der "physikalischen AGI" immer nähern.
Von der Laborarbeit zur industriellen Front: Aufbruch in Richtung physischer AGI
Die verschiedenen Forschungsergebnisse von Jijia Vision beruhen auf seinem Kernteam - dem Labor für Intelligente Bildverarbeitung der Fakultät für Automatisierung der Tsinghua-Universität.
Huang Guan, Gründer und CEO des Unternehmens, ist ein Promotionsstudent der Fakultät für Automatisierung der Tsinghua-Universität. Er war früher Leiter der visuellen Wahrnehmungstechnologie bei Horizon Robotics und hat auch in Instituten wie dem Microsoft Research Asia und dem Samsung China Research Institute gearbeitet.
Dr. Huang Guan hat die technologische und industrielle Entwicklung der physischen KI in den letzten zehn Jahren miterlebt. Er hat sein Team mehrmals zu Weltmeisterschaften in global anerkannten KI-Wettbewerben geführt und mehrere weltweit bekannte KI-Ergebnisse veröffentlicht. In der Richtung der physischen KI verfügt er über reiche Erfahrungen in technologischer Innovation, industrieller Umsetzung und aufeinanderfolgenden Unternehmungen.
Das Kernteam von Jijia Vision ist eines der ersten chinesischen Teams, das sich auf die End-to-End-Modellierung der physischen Welt konzentriert hat. Es hat kontinuierlich technologische Durchbrüche und die industrielle Umsetzung von Algorithmen für die physische KI wie Objekterkennung, Gesichtserkennung, BEV, OCC, End-to-End-Systeme und Weltmodelle vorangetrieben.
Im Bereich der weltweiten physischen KI-Basismodelle umfasst das Team ehemalige Vizepräsidenten und Architekturexperten großer Internetunternehmen, Wissenschaftler aus den Weltspitzen-2 % mit fast 20.000 Zitierungen, Weltmodellwissenschaftler mit mehr als 10 ersten Autorenpositionen in Top-Konferenzen, Branchenexperten mit über 10 Jahren Erfahrung in der Massenproduktion von physischen KI-Systemen, Preisträger des Huawei Genius-Junior-Programms sowie Algorith