Jiangxing Intelligence: Vom Wahrnehmen der Umwelt zur Veränderung der Welt: Chancen, Wege und Praktiken von Physical AI | 2026 AI Partner · AI + Industrie-Konferenz in Beijing Yizhuang
Der wahre Vorteil von Industrial Physical AI in China liegt nicht in den Modellparametern, sondern in der 12-fachen Industrieroboter-Einsatzdichte, der doppelten Stromerzeugung und den dichten 5G-Edge-Knoten weltweit. Die Kombination aus Szenariodichte, Infrastrukturbasis und Open-Source-Modellen treibt Physical AI von der Laborphase hin zur massstäblichen Umsetzung voran.
Jiangxing Intelligence hat ein dreistufiges Modell für Industrial Physical AI entwickelt. Dieses System wurde bereits in Anwendungsfällen wie der Inspektion von erneuerbaren Energieanlagen und Stromnetzen umgesetzt – es deckt Gebiete wie Guizhou und Inner mongolien ab, und die Genauigkeit des Kernalgorithmus erreicht 99%. Chen Long betonte besonders, dass eine scheinbar einfache Inspektionsaufgabe in industriellen Szenarien normalerweise in 100 bis 200 Teilaufgaben aufgeteilt werden muss, was an die Stabilität und Zuverlässigkeit von AI weit höhere Anforderungen stellt als bei Verbraucheranwendungen.
Im Folgenden finden Sie den Inhalt des Vortrags, der von 36Kr bearbeitet wurde:
Chen Long | CTO von Jiangxing Intelligence's Basismodell
Sehr geehrte Gäste und Branchenpartner, guten Nachmittag! Ich bin Chen Long, CTO des Embodied Basismodells von Jiangxing Intelligence. Mein Vortragsthema lautet: "Von der Umweltwahrnehmung zur Veränderung der Welt: Chancen, Wege und Herausforderungen von Physical AI".
Der Wettlauf um die Spitze in der AI-Branche hat sich von der Konkurrenz um die Modellparameter in der digitalen Welt zur Konkurrenz um die Systemfähigkeiten in der realen physischen Welt verschoben. China wird dank seiner einzigartigen fünfschichtigen Industriebasis zum besten Standort für die Umsetzung von Industrial Physical AI weltweit. Jiangxing Intelligence hat durch die Schaffung einer ganzheitlichen Architektur für Industrial Physical AI in Kernbereichen wie erneuerbaren Energien und Stromnetzen eine massstäbliche Umsetzung erreicht, was die Machbarkeit der Überführung von Physical AI von der Theorie in die Praxis beweist.
Der Wettlauf um die Spitze in der AI-Branche verschiebt sich von der Modellkonkurrenz zur Konkurrenz um physische Systeme
In den letzten Jahren hat generative AI in der digitalen Welt ihren Wert eindrucksvoll bewiesen und kann Aufgaben wie Inhaltserstellung, Code-Schreiben und intelligente Fragenbeantwortung erledigen. Für Industriebetriebe liegt der wahre Wert aber nicht auf dem Bildschirm, sondern in realen physischen Räumen wie Windparks, Photovoltaikanlagen, Substationen, Minen, Chemieparken und Produktionshallen.
AI durchläuft einen entscheidenden Wandel von der "Antwortgenerierung" zur "Aufgabenausführung". Wenn AI in die industrielle Praxis eintritt, liegt der Kern des Wettlaufs nicht mehr in der Größe der Modellparameter oder der Genauigkeit einzelner Algorithmen, sondern darin, ob künstliche Intelligenz stabil, kontrollierbar und kostengünstig in die reale physische Welt integriert werden kann. Industrielle Aufgaben sind nie so einfach wie "ein Bild betrachten und feststellen, ob etwas abnormal ist". Sie erfordern den gesamten Prozess von Datenakquise, Umweltverständnis, Geräteanbindung, Aufgabenplanung, Ausführungsrückmeldung und geschlossener Iteration. Das bedeutet, dass Physical AI kein isoliertes Modell ist, sondern ein vollständiges intelligentes System, das am Einsatzort kontinuierlich betrieben werden kann.
Die fünfschichtige Basis und die drei strukturellen Chancen von Industrial Physical AI in China
Warum hat Industrial Physical AI in China die besten Voraussetzungen für die Umsetzung? China hat eine fünfschichtige systemische Basis geschaffen, die von anderen Ländern schwer nachgeahmt werden kann.
Die erste Schicht ist die Anwendungs-Schicht. China hat die weltweit höchste Dichte an industriellen Szenarien. Die Anzahl der installierten Industrieroboter ist etwa 8,6-mal so hoch wie in den USA und hat in den letzten zehn Jahren um etwa das 12-fache zugenommen. Je dichter die realen Szenarien sind, desto leichter bildet sich die geschlossene Schleife von "Daten - Modell - Embodied Intelligence Roboter".
Die zweite Schicht ist die Modell-Schicht. Chinesische Open-Source-Modelle wie DeepSeek, Tongyi Qianwen (Qwen) und Kimi verfolgen die Spitzenleistungen schnell nach und nähern sich in ihrer Leistung schnell dem Branchenbesten. Sie wurden bereits in der gesamten Branche umfassend vertikal implementiert und nähern sich immer mehr den tatsächlichen Bedürfnissen der Industrie.
Die dritte Schicht ist die Infrastruktur-Schicht. Die Anzahl der chinesischen 5G-Basisstationen hat 4,48 Millionen überschritten und macht weltweit mehr als 60% aus. Gleichzeitig ist das neu hinzugekommene Stromerzeugungsvolumen weit höher als in den USA. Dies gibt uns an den Endgeräten und am Edge eine stärkere Netz- und Infrastrukturfähigkeit, die die Anbindung und Echtzeitinteraktion von Physical AI-Geräten am Einsatzort besser unterstützen kann.
Die vierte Schicht ist die Chip-Schicht. Es besteht kein Zweifel daran, dass wir in der Spitzentrainingschip-Branche immer noch hinter den USA zurückbleiben. Dieser Herausforderung hat die Branche jedoch zu effizienteren Technologierouten gedrängt und Unternehmen dazu gebracht, durch bessere Modellstrukturen, Endgeräte-Edge-Kooperation und Software-Hardware-Synergien das Leistungspotenzial der vorhandenen Hardware zu maximieren.
Die fünfte Schicht ist die Energie-Schicht. Derzeit ist die Stromerzeugung in China etwa doppelt so hoch wie in den USA, und die Installationsmenge von Stromerzeugungsanlagen ist sogar dreimal so hoch. Die ausreichende und stabile Energieversorgung bietet eine langfristige Basis für die Überführung von AI von der Cloud-Trainingsphase zur massstäblichen Einsatzortimplementierung.
Die Kombination dieser fünf Schichten macht China nicht nur zu einem Ort mit technologischen Visionen, sondern auch zu einem realen Boden für die Umsetzung von Industrial Physical AI. Auf dieser Grundlage haben wir drei Kernstrukturchancen für Industrial Physical AI in China identifiziert.
Die erste Art von Chancen liegt in der Basisversorgung. Die kontinuierliche Verbesserung von Energie, Netz, Infrastruktur und Edge-Knoten bietet eine langfristige und zuverlässige Unterstützung für den Eintritt von AI in die industrielle Praxis.
Die zweite Art von Chancen liegt in der geschlossenen Schleife am Einsatzort. Die hohe Dichte an industriellen Szenarien, die massstäbliche Roboterinstallation und die multimodalen Sensoreinrichtungen ermöglichen es Physical AI, eine vollständige Daten-Schleife von "Installation - Akquise - Training - Iteration - Neuinstallation" zu bilden, was ein unübertroffener Vorteil gegenüber anderen Ländern ist.
Die dritte Art von Chancen liegt in der Effizienzroute. Die Beschränkungen bei Spitzenchips werden die Branche zu effizienteren Modellen, stärkerer Edge-Intelligenz und tieferer Software-Hardware-Kooperation treiben und Industrial Physical AI stärker auf Kosteneffizienz, Kontrollierbarkeit und Installierbarkeit ausrichten.
Jiangxing Intelligence hat sich zum Ziel gesetzt, diese kombinierten Vorteile zu einem installierbaren, replizierbaren und kontinuierlich iterierbaren Industrial Physical AI-System zu formen.
Die ganzheitliche Architektur für Industrial Physical AI von Jiangxing Intelligence
Probleme in der industriellen Praxis können nicht mit einem einzelnen Modell gelöst werden. Sie erfordern die Zusammenarbeit von Dateninfrastruktur, Modellierung der physischen Welt, Branchen-Großmodellen, Anwendungsframeworks, Gerätekontrolle und Sicherheitsmechanismen. Basierend auf diesem Verständnis hat Jiangxing Intelligence eine dreistufige, ganzheitliche Architektur für Physical AI für industrielle Szenarien entwickelt, die auf die Kernanforderungen von Industrial Physical AI an Autonomie, Multimodalität, Langzeitaufgaben und Zuverlässigkeit ausgelegt ist.
Daten- und Infrastruktur-Schicht: JX-Phi World mit Doppelantrieb
Als Basis der gesamten Architektur verwendet JX-Phi World ein Kerndesign mit Doppelantrieb durch AutoEdge und AutoWorld, um die Probleme schnellerer Modelltraining, stabilerer Umsetzung und niedrigerer Kosten zu lösen.
AutoEdge ist für die vollständige Verarbeitung von realen industriellen Daten verantwortlich, einschließlich multimodaler Umwelt-Datenakquise, Cloud-Training, Edge- und Endgeräte-Inferenz, Modellinstallation und OTA-Upgrades. Es kann kontinuierlich Daten über Aufgaben, Geräte, Betriebszustände und Rückmeldungen aus der realen Einsatzumgebung sammeln und gleichzeitig den Netzwerkverkehr und die End-to-End-Latenz des Modells durch Edge-Inferenz erheblich reduzieren. Die zugrunde liegenden Daten umfassen Informationen aus allen Dimensionen der industriellen Einsatzumgebung, wie Sensoren, Wärmebildkameras, Drohneninspektionen und Fernerkundung von niedrigorbitierenden Satelliten.
AutoWorld ist ein Weltmodell-Simulations- und Daten-Engine. Ein großes Problem bei industrieller AI besteht darin, dass viele kritische Anomalien nicht häufig auftreten, aber wenn sie auftreten, müssen sie genau erkannt und zuverlässig behandelt werden. Reale industrielle Daten decken normalerweise nur 90% bis 95% der normalen Szenarien ab, und es gibt Datendefizite bei 5% der potenziellen Risiken und extremen Betriebszuständen wie extremer Witterung und Unfällen. AutoWorld nutzt generative AI und 3D-Rekonstruktionstechniken, um verschiedene seltene Szenarien und komplexe Aufgabenabläufe zu simulieren und zu generieren, und unterstützt die Sim-to-Real-Übertragung, damit AI in der Simulationsumgebung alle Fehler machen kann, bevor es in die reale Einsatzumgebung installiert wird.
Modell-Schicht: JX-Phi Brain entwickelt sich zum World Action Model (WAM) für industrielle Szenarien
JX-Phi Brain ist das Kerngehirn der gesamten Architektur und entwickelt sich zum World Action Model (WAM) für industrielle Szenarien. Es vereint drei Kernfähigkeiten.
Die erste Art von Fähigkeiten ist das Raumvisuallinguistische Modell (S-VLM), das das Problem der "Wahrnehmung + Verständnis" löst. Die industrielle Einsatzumgebung ist keine zweidimensionale Karte, sondern eine dynamische Umgebung, die Geräte, Personen, räumliche Beziehungen, Betriebszustände und Branchenregeln umfasst. S-VLM kann nicht nur die physische Umgebung der Industriehalle wahrnehmen, sondern auch die Messwerte verschiedener Sensoren und Umweltparameter verstehen und so transmodale Inferenz und Modellierung von industriellen Szenarien ermöglichen.
Die zweite Art von Fähigkeiten ist das Langzeitvisuallinguistische Aktionsmodell (LT-VLA), das das Problem der "Wahrnehmung + Ausführung" löst. Industrielle Aufgaben werden normalerweise nicht in einem Schritt erledigt, sondern erfordern die Zusammenarbeit von mehreren Aufgaben, Geräten und Prozessen. LT-VLA kann die Einschränkungen der Einsatzumgebung und die Aufgabenanforderungen wahrnehmen, komplexe industrielle Aufgaben in eine Reihe von ausführbaren Teilaufgaben zerlegen und eine selbstgesteuerte Optimierung und dynamische Anpassung der Aufgaben durchführen.
Die dritte Art von Fähigkeiten ist das branchenspezifische Modell, das das Fachwissen aus Branchen wie Elektrizität, Chemie und Bergbau in das Modell integriert, damit das Modell reale Aufgaben unter starken Regeln, Einschränkungen und Sicherheitsanforderungen verstehen kann. Jiangxing hat derzeit in Branchen wie Elektrizität, Chemie und Bergbau die routinemäßige Datenakquise in über 1.000 Anlagen und Standorten unterstützt und kontinuierlich die geschlossene Schleife von "Modell + Daten" aufgebaut.
Anwendungs-Schicht: JX-Phi Agent setzt den Wert durch Industrial Harness und One-Brain-Multiple-Bodies um
Das Modell selbst schafft keine industriellen Werte automatisch. Der Wert entsteht erst, nachdem das Modell in ein installierbares, aufrufbares und überwachbares System am Einsatzort verpackt wurde. Der Kern der Anwendungs-Schicht von JX-Phi Agent sind die beiden Technologien Industrial Harness und One-Brain-Multiple-Bodies-Kontrolle.
Industrial Harness ist für die Organisation von Aufgabenaufteilung, Sicherheitsvorschriften, Werkzeugaufruf, Regeln, Anomalieantwort und vollständiger Protokollierung verantwortlich. Es sorgt dafür, dass das Modell nicht frei agiert, sondern streng innerhalb des industriellen Prozesses und der Sicherheitsgrenzen arbeitet. Gleichzeitig kann es das Branchenwissensrepository und spezielle Modelle der unteren Ebene integrieren, die Ausgabe des Modells automatisch überprüfen und die manuelle Überprüfung durch Experten unterstützen.
One-Brain-Multiple-Bodies ist ein Kooperationskontroll-Engine für komplexe Einsatzumgebungen. Der Kern ist ein globaler Prä-Kontroller mit einer Parameteranzahl von 100 Milliarden, der die globale Aufgabenplanung und -verwaltung über verschiedene Arbeitsbereiche hinweg übernimmt. Ein Standort-Brain kann verschiedene Endgeräte wie Drohnen, Roboterhunde, Radroboter, feste Kameras, Sensoren und Roboterarme anbinden und die Aufgabenverteilung, Status-Synchronisierung, Konfliktauflösung und Kooperationsausführung realisieren. Diese Architektur wurde bisher erfolgreich in komplexen Szenarien wie dem Stromnetz in den Bergen von Guizhou und der Photovoltaikanlage in der Wüste von Inner mongolien installiert und hat die massstäbliche Anwendung von Embodied-Endgeräten auf der Kunden-Seite ermöglicht.
Vier Schlüsseltechnologien unterstützen die Umsetzung von Industrial Physical AI
Um die effiziente Funktionsweise der ganzheitlichen Architektur zu unterstützen, hat Jiangxing Intelligence in vier Kerntechnologiebereichen entscheidende Durchbrüche erzielt.
Die erste Schlüsseltechnologie ist die dynamisch aktualisierbare Basis für industrielle Szenarien. Die reale industrielle Einsatzumgebung ändert sich ständig, und ein einmal erstelltes 3D-Modell wird schnell von der realen Situation abweichen. Jiangxing hat mit der TrackerSplat-Technologie das Problem der stabilen Rekonstruktion in dynamischen Szenarien gelöst und kann während der Bewegung des Roboters die Daten von wichtigen Sensoren wie Messinstrumenten klar erfassen und Umgebungsrauschen wie Regentropfen und elektromagnetische Störungen effektiv filtern. Gleichzeitig hat es mit der SizeGS-Technologie das Problem der Komprimierung und Übertragung von 3D-Inhalten in einem schwachen Netz gelöst und sichergestellt, dass die Prüfergebnisse und die Zwischenentscheidungen stabil an das Cloud-Brain zurückgesendet werden können.
Die zweite Schlüsseltechnologie ist das Weltmodell und die physikalische Simulation. Die Kosten für reale Fehlversuche in der industriellen Praxis sind extrem hoch, insbesondere in Branchen wie Elektrizität, Energie und Chemie. Einige Fehler dürfen in der realen Welt überhaupt nicht auftreten. Jiangxing hat mit dem Weltmodell eine geschlossene Trainingsschleife aus "Reality - Simulation - Reality" aufgebaut, damit die Roboterstrategien zuerst in der Simulation fehlschlagen, bewertet und iteriert werden können, bevor sie in die reale Welt übertragen werden. Dies hat die Risiken und Kosten der Umsetzung erheblich gesenkt.
Die dritte Schlüsseltechnologie ist die multimodale Wahrnehmung und die Ursachenanalyse. Jiangxing hat Infrarot-Wärmebildkameras, sichtbares Licht, 3D-Rauminformationen, Gerätestatusdaten sowie Daten aus Drohnen- und Fernerkundung von niedrigorbitierenden Satelliten integriert, damit das Modell nicht nur Anomalien erkennen, sondern auch verstehen kann, wo sie auftreten, warum sie wichtig sind, welchen Risikograd sie haben und wie sie behandelt werden sollten. Dies markiert den Spr