Jijia Shijie hat zwei Runden von Finanzierungen in der Größenordnung von Hunderten von Millionen Yuan in der Pre-A- und Pre-A+-Phase abgeschlossen und beschleunigt mit Weltmodellen das Eintreten des "ChatGPT-Moments in der physischen Welt".
Kürzlich hat die Firma Physical AI, Jijia Vision, angekündigt, dass sie in aufeinanderfolgenden Runden der Vor-Serie A und Vor-Serie A+ mehrere Hundert Millionen Yuan an Finanzierungen abgeschlossen hat. Die Vor-Serie A-Finanzierung wurde von Guozhong Capital als Hauptinvestor geleitet, gefolgt von Zifeng Capital und den alten Aktionären PKSHA Algorithm Fund. Die Vor-Serie A+-Finanzierung wurde von CICC Capital, Guangzhou Industrial Investment, Yicun Songling und Huaqiang Capital investiert.
Im Februar 2025 absolvierte Jijia Vision auch eine Angel++-Runde von mehreren Millionen Yuan, investiert von Puchao Capital, Heding Gong Capital und der Shanghai Angel Association.
Die Tatsache, dass Jijia Vision in nur sechs Monaten drei aufeinanderfolgende Finanzierungsrunden absolvierte, zeigt deutlich die Anerkennung des Kapitalmarktes für die Stärke des Teams, die technologische Route und die Fortschritte bei Produkten und Geschäftstätigkeiten.
Jijia Vision ist ein Unternehmen für allgemeine Intelligenz in der physischen Welt, das im Juni 2023 gegründet wurde. Es konzentriert sich auf das "Weltmodell-getriebene Basis-Modell der physischen Welt" und beschleunigt den Weg zur allgemeinen Intelligenz in der physischen Welt.
Die Produkte des Unternehmens umfassen die Weltmodell-Plattform GigaWorld (Fahren + Embodied), das Embodied Basis-Modell GigaBrain, allgemeine Embodied-Körper und andere Produkte der Physical AI-ganzen Stapelserie. Zuvor hatte das Unternehmen bereits mehrere Finanzierungsrunden im Milliardenbereich, einschließlich der Seed-, Angel- und Angel+-Runden, abgeschlossen.
Anfang 2023 löste der ChatGPT-Moment auf Basis von Sprachmodellen die allgemeine Intelligenz in der digitalen Welt völlig aus und brachte enorme technologische Fortschritte, einen Ausbruch von AI-Anwendungen und soziale Auswirkungen mit sich. Derzeit wird der "ChatGPT-Moment" in der physischen Welt zum nächsten hoch interessanten Moment.
Jijia Vision ist der Ansicht, dass das Paradigma von "Weltmodell + VLA + Verstärkendes Lernen" allmählich vervollständigt wird und innerhalb von 2 - 3 Jahren der ChatGPT-Moment in der physischen Welt eintreten wird, was tiefgreifendere technologische Durchbrüche in der Physical AI, einen Ausbruch von Anwendungen und soziale Auswirkungen mit sich bringt.
Im Ausland setzen führende Technologieunternehmen wie NVIDIA, Google DeepMind und World Labs aktiv in Richtung Weltmodell ein und erzielen rasche Fortschritte.
Zur gleichen Zeit wird das "VLA + Verstärkendes Lernen" auf Basis echter Geräte rasch weiterentwickelt und erweitert, aber es steht vor einem enormen Datenengpass. Das "Weltmodell" ist die beste Lösung für den Datenengpass bei der allgemeinen Intelligenz in der physischen Welt auf Basis echter Geräte.
"Der von uns definierte ChatGPT-Moment in der physischen Welt ist, dass bei 100 häufigen Aufgaben in 90 % der Szenarien eine Erfolgsrate von 95 % erreicht wird." sagte Dr. Huang Guan, Gründer und CEO von Jijia Vision.
"Die Annahme, dass dieser Moment in 2 bis 3 Jahren eintreten wird, basiert auf der gegenwärtigen Geschwindigkeit der technologischen Fortschritte. In unserem Paradigma löst VLA die Komplexität der Aufgaben, das Weltmodell löst die Generalisierbarkeit und das Verstärkende Lernen löst die Genauigkeit und Zuverlässigkeit. Wenn diese drei Elemente zusammenarbeiten, wird der Ausbruch von Anwendungen in der Physical AI beschleunigt." sagte Dr. Huang Guan.
Nach Ansicht von Huang Guan wird der ChatGPT-Moment in der physischen Welt einen 10- bis 100-fachen Ausbruch von Anwendungen im Vergleich zu Sprachmodellen bringen, insbesondere im Bereich der privaten Haushalte und Dienstleistungen. Die Vision von Jijia Vision ist es, diesen riesigen Markt zu bedienen.
Als das erste chinesische Technologieunternehmen, das sich auf die Richtung "Weltmodell" konzentriert, befindet sich Jijia Vision sowohl in der Richtung "Weltmodell" als auch in der Richtung "VLA-Großmodell" auf Weltklasse-Niveau und führt kontinuierlich die Entwicklung der relevanten Technologien und die Umsetzung in der Industrie an.
In der Richtung Weltmodell treibt Jijia Vision kontinuierlich die technologische Innovation und die Umsetzung in der Industrie voran und hat bereits Verträge und Massenproduktionskooperationen mit mehreren führenden Unternehmen aus der Robotik- und Automobilindustrie abgeschlossen.
In der Richtung des end-to-end VLA Embodied Basis-Modells verfügt Jijia Vision über branchenführende Ergebnisse auf echten Geräten, das beste Modell-Architekturdesign, die höchste Datennutzungseffizienz und hat bereits mit der Massenproduktion begonnen.
Spitze Team: Weltklasse-Team für ganzer Stapel von Algorithmus-Modellen arbeitet zusammen mit einem Team von Branchenexperten und Führungskräften
Jijia Vision ist eng mit dem Labor für Intelligente Visuelle Systeme der Fakultät für Automatisierung der Tsinghua-Universität verbunden. Das Kernteam besteht aus Spitzenforschern von renommierten Universitäten wie der Tsinghua-Universität und der chinesischen Akademie der Wissenschaften sowie von Führungskräften und Branchenexperten aus renommierten Unternehmen wie Baidu, Microsoft und Horizon Robotics.
Das Kernteam hat über 200 Artikel in Spitzenkonferenzen und Zeitschriften der Künstlichen Intelligenz veröffentlicht, hat mehrere Weltmeisterschaften in den weltweit einflussreichsten Wettbewerben der Künstlichen Intelligenz gewonnen und hat mehrere weltweit einflussreiche technologische Ergebnisse in der Künstlichen Intelligenz veröffentlicht.
Das Team verfügt in der Richtung Physical AI über weltklasse-Forschungskapazitäten, Erfahrung in der Architektur-Engineering von sehr großen Skalen und Erfahrung in der Massenproduktion und Umsetzung von sehr großen Skalen.
Dr. Huang Guan, CEO ist ein Doktor der Fakultät für Automatisierung der Tsinghua-Universität und ein national anerkannter führender Innovator. Er hat sein Team mehrmals zu Weltmeisterschaften in global anerkannten AI-Wettbewerben geführt und mehrere weltweit bekannte AI-Ergebnisse veröffentlicht.
Dr. Huang Guan hat auch Forschungsarbeiten in renommierten Unternehmen wie Microsoft, Samsung und Horizon Robotics absolviert, hat mehrmals Teams von über hundert Forschern geleitet und verfügt über reiche Erfahrung in aufeinanderfolgenden Unternehmensgründungen in der Richtung Physical AI. Als Kern-Führungskraft hat er insgesamt über eine Milliarde Yuan an Finanzierungen geleitet oder mitgewirkt.
Dr. Zhu Zheng, Chefwissenschaftler hat über 70 Artikel in Spitzenkonferenzen in den Bereichen Visuelle Wahrnehmung und Künstliche Intelligenz veröffentlicht, die über 16.000 Mal zitiert wurden. Er ist einer der chinesischen jungen Wissenschaftler mit den meisten Zitaten in der Richtung AI.
Mao Jiming, Vicepräsident für Engineering hat über 16 Jahre Erfahrung in den Bereichen Simulation, Engineering, Daten und verteilte Architekturen. Er war früher der Leiter der Simulation und des Engineerings bei Baidu Apollo und Architekt bei Baidu und Yingche auf T10-Ebene.
Dr. Sun Shaoyan, Vicepräsident für Produkte war früher Direktor bei Alibaba Cloud und Geschäftsführer der Daten-Closed-Loop-Produktlinie bei Horizon Robotics. Er hat branchenführende Erfahrung in der Entwicklung von Produkten und Architekturen für Daten-Closed-Loop-Systeme in der physischen Welt.
Das Kernteam des Unternehmens umfasst ein Weltklasse-Team für den gesamten Stapel von Algorithmen, Daten und Infrastruktur, ein Hardware-Team mit reicher Erfahrung in der Massenproduktion von humanoiden Robotern sowie ein Team von Branchenexperten und Führungskräften mit langjähriger Branchenerfahrung.
Technologischer Führer: Weltmodell-getrieben, führt das neue Paradigma der globalen Embodied Intelligenz an
Das Weltmodell ist die Simulation 2.0 und auch die nächste Generation von VLA: Mit der raschen Entwicklung der generativen AI wird die Simulation 2.0 auf Basis des generativen Weltmodells zur wichtigsten Datenquelle für die allgemeine Intelligenz in der physischen Welt.
Durch die Simulation und Generierung von unendlichen parallelen Welten, die visuell realistisch, geometrisch genau und physikalisch präzise sind, und die Generierung unendlicher interaktiver Aktionen auf Basis von interaktiven Umgebungen bietet die Simulation 2.0 einen neuen technologischen Weg und Unterstützung für das Training und die Tests des end-to-end VLA Großmodells.
Zugleich wird das Weltmodell allmählich in die Roboter-Endgeräte einfließen und die nächste Generation von VLA werden, da seine Generierungsfähigkeiten stetig zunehmen.
Globales führendes VLA Embodied Basis-Modell: Im Juli 2025 veröffentlichte Jijia Vision das weltweit erste Weltmodell-getriebene Embodied Basis-Modell GigaBrain-0 Preview, das das Datenproblem der Embodied Intelligenz mit einem neuen Paradigma löst.
GigaBrain-0 ist ein Zwei-System end-to-end VLA Embodied Basis-Modell mit räumlicher Inferenzfähigkeit, das sanft und reibungslos komplexe Langzeitaufgaben wie flexible Manipulationen, Zwei-Arm-Koordination, offene Interaktionen und autonome Inferenzen realisieren kann.
Noch wichtiger ist, dass GigaBrain-0 bei der Datenquelle einen bahnbrechenden Fortschritt erzielt hat. Über 90 % der Daten stammen aus den generierten Daten der selbst entwickelten "Weltmodell-Plattform" von Jijia Vision, und weniger als 10 % stammen aus echten Daten von echten Geräten. So wird eine maximale Generalisierbarkeit mit minimalen Kosten erreicht.
Basierend auf der massiven Menge an Daten, die vom Weltmodell generiert werden, hat GigaBrain-0 weltweit erstmals die "Null-Sample"-Generalisierung in einem offenen Universum für flexible, komplexe Langzeitaufgaben realisiert. Die herausragenden Leistungen von GigaBrain-0 bieten ein neues Paradigma für die Lösung des Datenproblems der Embodied Intelligenz.
Im September 2025 wird Jijia Vision die offizielle Version von GigaBrain-0 veröffentlichen.
Globale führende Weltmodell-Plattform für Fahren und Embodied: Die Weltmodell-Plattform von Jijia Vision wird in zwei Richtungen angewendet: Fahren und Embodied.
In der Richtung des Fahr-Weltmodells führt Jijia Vision kontinuierlich die technologischen Durchbrüche und die Massenproduktion in diesem Bereich an.
Es hat eine Reihe repräsentativer Ergebnisse wie DriveDreamer, DriveDreamer-2, DriveDreamer4D, ReconDreamer und ReconDreamer++ veröffentlicht, und alle diese Ergebnisse wurden in Spitzenkonferenzen in den Bereichen Visuelle Wahrnehmung und Künstliche Intelligenz aufgenommen.
In der Richtung des Embodied Weltmodells hat Jijia Vision repräsentative führende akademische Arbeiten wie EmbodieDreamer, RoboTransfer und EmbodiedGen veröffentlicht.
Jijia Vision verfügt sowohl in der Richtung des Video-Weltmodells als auch in der Richtung des 3D-Weltmodells in der Embodied Intelligenz über branchenführende technologische Erfahrungen und Modellleistungen und hat bereits mit der breiten Anwendung in der Praxis begonnen.
Jijia Vision wird in Kürze die Embodied Weltmodell-Plattform GigaWorld-0 veröffentlichen. Wir laden Sie herzlich ein, sich dafür zu interessieren.
Beschleunigung der Massenproduktion: Zusammenarbeit mit der Branche zur Beschleunigung der Massenproduktion und Umsetzung, beschleunigt den Weg zur allgemeinen Intelligenz in der physischen Welt
Seit seiner Gründung hat Jijia Vision die kommerzielle Massenproduktion und Umsetzung immer an erster Stelle gestellt.
Es war nicht nur das erste, das die Massenproduktion des Weltmodells im Bereich der autonomen Fahrweise umsetzte, sondern hat auch in den Richtungen Embodied Weltmodell und Embodied Großmodell breite Kooperationen und Umsetzungen erreicht. Durch die technologische Führung und die Zusammenarbeit mit der Branche wird die Massenproduktion beschleunigt, und der Weg zur allgemeinen Intelligenz in der physischen Welt wird beschleunigt.
In der Richtung des Fahr-Weltmodells hat Jijia Vision Verträge und Massenproduktionskooperationen mit mehreren führenden chinesischen Automobilherstellern, ausländischen und joint-venture Automobilherstellern, AI-Chip-Herstellern und Tier-1-Unternehmen abgeschlossen.
In der Richtung des Embodied Weltmodells hat Jijia Vision tiefe Kooperationen mit mehreren Innovationszentren und Ausbildungseinrichtungen für humanoide Roboter abgeschlossen und hat umfassende Produkte wie weltweit führende Trainingsplattformen, die virtuelle und reale Welt kombinieren, entwickelt.
In der Richtung des Embodied VLA Großmodells hat Jijia Vision tiefe Kooperationen mit mehreren globalen Automobilkonzernen und führenden Embodied-Körper-Unternehmen abgeschlossen. Alle Beteiligten arbeiten gemeinsam an der Umsetzung der Embodied Intelligenz in verschiedenen Szenarien wie der Industrie, Dienstleistungen und privaten Haushalten.
Jijia Vision wird die Finanzierungsgelder hauptsächlich für die Forschung und Entwicklung von technologischen Produkten und die Marktbearbeitung einsetzen. Darüber hinaus wird es auch mehr in die Kundendelivery investieren.
Neben den Vorteilen in der Algorithmen-Entwicklung verfügt Jijia Vision auch über Vorteile in den Bereichen Daten, Infrastruktur und Umsetzung in der Industrie. Es dient den Kundenbedürfnissen auf vielfältige Weise und treibt die Branche beschleunigt in Richtung "ChatGPT-Moment in der physischen Welt" voran.