Huawei's Embodied Brain No. 1: Developing Brain - inspired Intelligent World Model, Competing with JEPA, Secures Hundreds of Millions in Financing

Fördern Sie die Umsetzung des Weltmodells des kognitiven Denkens in der künstlichen Intelligenz, die auf dem menschlichen Gehirn basiert.

Autor | Huang Nan

Redakteur | Yuan Silai

Hard Kr hat erfahren, dass das Unternehmen für körperliche Intelligenz "Juenao Panshi" eine neue Runde von Finanzierungen im Milliardenbereich abgeschlossen hat. Diese Runde von Finanzierungen wurde von Spitzenbranchenkapital mit tiefgreifender Branchenbackground in der Hirn- und körperlichen Intelligenz angeführt. Alte Aktionäre und mehrere Spitzenfonds haben erneut investiert und mitinvestiert. Duowei Capital hat als exklusiver Finanzberater fungiert. Gleichzeitig ist auch eine weitere Runde von Finanzierungen im Gange.

Die Mittel werden hauptsächlich in die Forschung und Entwicklung von Kerntechnologien, die Erweiterung des Personalteams und die Erschließung des globalen Marktes investiert, um die Forschung und Entwicklung, die Engineering-Implementierung und die Validierung in realen Szenarien des Kognitiven Weltmodells (Cognitive World Model) zu beschleunigen.

Kognitives Weltmodell der Hirn-ähnlichen Intelligenz (Bildquelle/Unternehmen)

Juenao Panshi wurde im Jahr 2025 gegründet und baut auf der Hirn-ähnlichen Intelligenz als Basisparadigma ein Kognitives Weltmodell (Cognitive World Model) für die reale physische Welt auf. Das Unternehmen wurde von Zhu Senhua, dem "Chef des körperlichen Gehirns von Huawei", gegründet und von ihm als CEO geleitet. Er hat sich lange Zeit auf die interdisziplinäre Forschung zwischen KI und Hirnkognition konzentriert. Er hat an der Sun Yat-sen-Universität an der Informatik und KI geforscht, promoviert an der Universität von Pennsylvania in der kognitiven Neurowissenschaft und eine Post-Doktorarbeit am Nationalen Schwerpunktlabor für Hirn- und Kognitionswissenschaften der chinesischen Akademie der Wissenschaften abgeschlossen.

Nach seinem Eintritt in Huawei hat Zhu Senhua den Leiter des Innovations-Lab für KI-Algorithmen von Huawei Cloud innegehabt und an Projekten wie der KI-Hirnwissenschafts-Cloudplattform, dem Pangu-körperlichen Großmodell und dem globalen Innovationszentrum für körperliche Intelligenz beteiligt. Er hat die systematische Validierung der Integration von Weltmodell und Hirn-ähnlicher Intelligenz vorangetrieben und ist der Begründer des körperlichen Intelligenzgehirns von Huawei. Er verfügt über die komplexen Fähigkeiten in der Forschung der Hirnkognition, der Innovation und Validierung der Hirn-ähnlichen KI-Route und der Implementierung der körperlichen Intelligenzbranche.

Zhu Senhua hat an der Technologieanwendungssummit für chinesische humanoide Roboter teilgenommen (Bildquelle/Unternehmen)

Der Mitbegründer Liu Jinyu hat sich lange Zeit auf die Produktivierung und Kommerzialisierung von KI-Robotertechnologien konzentriert. Er hat mehrere Produktabteilungen von Grund auf aufgebaut und weltweit kommerziell umgesetzt. Viele Technologie-, Lieferkett- und Betriebspartner kommen aus Forschungsinstituten wie Tsinghua-Universität, Peking-Universität, Fudan-Universität und der chinesischen Akademie der Wissenschaften und haben an KI-Algorithmen, Robotersystemen, Lieferketten und globaler kommerzieller Implementierung in Unternehmen wie Huawei, Lenovo, Megvii und Geek+ beteiligt. Das ursprüngliche Team deckt die gesamte Schleife von der vordersten Forschung, der Modellentwicklung bis zur Systemengineering-Implementierung ab.

In den letzten 12 Monaten hat sich der Trend im Bereich der körperlichen Intelligenz rasch gewandelt. Der Branchenbegriff ist von "VLA" auf "Weltmodell" gewechselt.

Feifei Li setzt auf Raumintelligenz, Yann LeCun hat das AMI Labs gegründet, um Kausalitätsschlussfolgerungen zu erforschen. Technologiegiganten wie Nvidia und Google DeepMind beschleunigen die Einrichtung von Technologien für physikalische Simulation und reale Interaktion. Hinter der Popularität bleibt jedoch eine grundlegende Frage unbeantwortet: Was ist eigentlich ein Weltmodell? Ist es ein neues akademisches Konzept, die Kerntechnologie der nächsten Generation von KI oder ein vorläufiges Konzept, das immer wieder vom Markt validiert wird? Die Definitionen und Wege, die verschiedene Teams geben, sind unterschiedlich.

Zhu Senhua, der Gründer von Juenao Panshi, ist der Meinung, dass man zur Antwort auf diese Frage zunächst zur Wurzel der Frage zurückkehren muss. "Um das Weltmodell wirklich zu verstehen, muss man seine technologische Wurzel und die Kernanforderungen klären und wissen, woher es kommt und welches grundlegende Problem es in der Branche lösen soll." Zhu Senhua sagte Hard Kr, "Die zugrunde liegende Logik des Weltmodells ist in das 'Mentale Modell' der Hirn- und Kognitionswissenschaft verwurzelt. Es ist das aktuelle vorderste interdisziplinäre System zwischen Hirnwissenschaft und KI. Ohne dieses kognitive System bleiben die meisten Diskussionen leicht auf der Ebene der Anordnung und Kombination von technischen Begriffen. Heute ist es VLA plus Weltmodell, morgen ist es Weltmodell plus VLA. Es scheint, als ob sich die Entwicklung rasch voranschreitet, aber tatsächlich wird die technische Essenz nicht erreicht."

Diese Einschätzung hat direkt die Wahl der technischen Route von Juenao Panshi beeinflusst. Aus Sicht des Teams von Juenao Panshi geht die körperliche Intelligenz von der "Bewegungsintelligenz" zur "Kognitionsintelligenz". Der Kern der nächsten Phase besteht nicht nur darin, dass Roboter Aufgaben verstehen und Bewegungen ausführen können, sondern auch darin, dass Roboter die Fähigkeiten des abstrakten Konzeptlernens mit wenigen Beispielen, der multi-dimensionalen Umgebungsperzeption, des Langzeitgedächtnisses und der aktiven Schlussfolgerung haben und stabil in verschiedenen Szenarien in der realen Welt agieren können.

Allerdings stehen der Implementierung der körperlichen Intelligenz derzeit noch mehrere Engpässe im Weg: Es ist schwierig, hochwertige reale Daten in großem Maßstab zu sammeln, die Generalisierungsfähigkeit der Modelle in verschiedenen Szenarien ist unzureichend. Bei jedem Eintritt in eine neue Umgebung muss das Modell oft neu trainiert werden, und Roboter fehlen auch die Fähigkeit des Langzeitgedächtnisses und des kontinuierlichen Lernens. Die Daten können nicht unbegrenzt gesammelt werden, und die Rechenleistung ist auch keine unbegrenzte Ressource.

Im Gegensatz dazu kann das menschliche Gehirn ohne eine riesige Menge von Lehrdaten und ohne hohe Energie- und Rechenleistungskosten kontinuierlich lernen, wahrnehmen, sich erinnern, vorhersagen, planen und handeln in einer komplexen und sich ständig ändernden Umgebung. Dies ist der Grund, warum Juenao Panshi die Hirn-ähnliche Intelligenz als Basisroute gewählt hat. Das heißt, nicht einfach den Gehirnaufbau zu simulieren, sondern die Kernfähigkeiten wie die funktionellen Nervenmechanismen der Gehirnintelligenz zu extrahieren und in berechenbare Algorithmen und Architekturen umzuwandeln, um schließlich das nächste Generation von körperlichen Intelligenzgehirn zu bauen.

Juenao Panshi hat von Anfang an ein Kognitives Weltmodell auf Basis der Hirn-ähnlichen Intelligenz vorgeschlagen, das in die gleiche Richtung wie die von Yann LeCun vorgeschlagene JEPA (Joint Embedding Predictive Architecture) Route geht. Basierend auf der gemeinsamen theoretischen Grundlage der aktiven Schlussfolgerung in der Kognitionswissenschaft konzentriert es sich auf die Schlussfolgerung, Planung und Modellierung der realen Welt. Der Wert von JEPA liegt darin, dass die KI nicht nur "aussichtlich richtige" Ergebnisse generiert, sondern auch lernt, wie sich der Zustand in einem abstrakten Repräsentationsraum entwickelt und zukünftige Trends ableitet, um so näher an den zugrunde liegenden Gesetzen der menschlichen Gehirnkognition der realen Welt zu kommen.

Aber für Roboter, die in der realen Umgebung Aufgaben ausführen müssen, reicht die Fähigkeit des "Repräsentation - Vorhersage" nicht aus, um einen vollständigen Intelligenzkreislauf zu bilden.

Intelligenzkreislauf (Bildquelle/Unternehmen)

Ein anschauliches Beispiel ist, dass beim Überqueren einer Straße Menschen keine genauen Messungen der Geschwindigkeit, des Abstands und der Ampelzeiten der Fahrzeuge vor, hinter, links und rechts vornehmen müssen. Sie können einfach einen Blick auf die Umgebung werfen und dann mit der passenden Geschwindigkeit und Rhythmus sicher über die Straße gehen. Dies ist die aktive Schlussfolgerung im mentalen Modell. Zhu Senhua sagte, dass das Kognitives Weltmodell, das Juenao Panshi entwickeln will, genau diese Fähigkeit in die Praxis umsetzen soll. Dadurch können Roboter nicht nur vorhersagen, wie sich die Welt verändert, sondern auch auf der Grundlage ihrer Umweltwahrnehmung selbständig Ziele setzen, Aktionen planen, Operationen ausführen und aus der Umweltrückmeldung kontinuierlich lernen, um ihr Verhalten zu korrigieren.

Dies bedeutet, dass ein Weltmodell, das für ein körperliches System verwendet werden kann, die gesamte Fähigkeit von der Zustandsvorhersage bis zur Entscheidungsumsetzung umfassen muss.

Konkret bei der Implementierungsroute wandelt das Unternehmen die Mechanismen wie die mehrkammerigen Neuronen, die nichtlineare Aufmerksamkeit, das mehrstufige Gedächtnis, die sparse Berechnung und die aktive Schlussfolgerung in der Hirnwissenschaft in anwendbare Algorithmenmodelle und Engineering-Systemarchitekturen um. Diese Route führt schließlich zu vier Kerntechnologiezielen: Wenige Daten, hohe Generalisierungsfähigkeit, lebenslanges Lernen und niedriger Energieverbrauch, um gemeinsam die realen Beschränkungen der körperlichen Intelligenz in Bezug auf die Datenkosten, die Anpassung an verschiedene Szenarien, den kontinuierlichen Betrieb und die Rechenleistungseinschränkungen zu überwinden.

Derzeit hat Juenao Panshi bereits mehrere systemweite Technologievalidierungen in den Bereichen der körperlichen Wahrnehmungsinteraktion, Planung, Mobilitätsnavigation, Bedienung und kollektiver Körperlichkeit abgeschlossen und mehrere PoC in realen Szenarien für Branchenkunden in China und im Ausland gleichzeitig vorangetrieben, um das Kognitives Weltmodell von der Algorithmusstruktur in das reale Robotersystem zu bringen.

Diese Art der Fortschritt von Algorithmus zu System bildet auch das Verständnis von Juenao Panshi für die Körperliche Intelligenz 2.0: Es geht nicht darum, dass Roboter in der Demonstration mehr Bewegungen ausführen können, sondern dass Roboter wirklich die kognitive Fähigkeit nahe am menschlichen Gehirn haben - von wenigen Erfahrungen abstrakte Regeln zu lernen, in einer komplexen Umgebung kontinuierlich zu wahrnehmen und sich zu erinnern und in verschiedenen Aufgaben und Szenarien aktive Schlussfolgerungen zu ziehen, stabile Entscheidungen zu treffen und kontinuierlich zu handeln.

Im Folgenden ist ein Auszug aus dem Interview von Hard Kr mit Zhu Senhua, dem Gründer von Juenao Panshi (leicht bearbeitet):

Hard Kr: Zurzeit gibt es viele Diskussionen über das Weltmodell auf dem Markt. Wie können wir dieses Konzept verstehen?

Zhu Senhua: Aus unserer Sicht gibt es eigentlich fünf Ebenen des Weltmodells, von unten nach oben: Die erste Ebene ist die visuelle Realität; repräsentiert durch die Raumintelligenz, die von Professorin Feifei Li geleitet wird, löst sie das Problem der realen Umwelt von 2D zu 3D. Die zweite Ebene ist die physikalische Realität; ähnlich wie Sora versteht man die physikalischen Gesetze durch die Anhäufung von Daten, aber es gibt noch Debatten darüber, ob diese Methode wirklich zuverlässig ist. Die dritte Ebene gehört zur interaktiven Realität; repräsentiert durch Google DeepMind und Nvidia, löst sie das Problem, wie Agenten in der Umgebung die Interaktionsprozesse wie Berührung und Rückmeldung lernen können.

Die vierte Ebene ist das abstrakte Lernen; repräsentiert durch die von Yann LeCun's Team vorgeschlagene JEPA, lernt man nicht mehr Pixel für Pixel, sondern abstrakt auf der Repräsentationsebene, um das Problem der Generalisierungsfähigkeit zu lösen.

Die fünfte Ebene ist die aktive Schlussfolgerung, d. h. die Theorie der aktiven Schlussfolgerung aus der kognitiven Neurowissenschaft, die auf wenige Daten, hohe Generalisierungsfähigkeit, lebenslanges Lernen und niedrigen Energieverbrauch abzielt; dabei hat das menschliche Gehirn bereits bewiesen, dass dieser Weg machbar ist.

Das technologische Hierarchiesystem des "World Model" in der technologischen Sicht von Juenao Panshi (Bildquelle/Unternehmen)

Diese fünf Ebenen sind keine parallelen oder voneinander unabhängigen Schulen, sondern ein System von der Infrastruktur zur Evolution der Intelligenzfähigkeiten. Die ersten drei Ebenen lösen das Problem, "wie man Daten und Trainingsumgebungen billiger und zuverlässiger erhält", und die letzten zwei Ebenen lösen das Problem der Algorithmusarchitektur, "wie man effizient lernt und schließt". Sie können getrennt erforscht werden oder sich gegenseitig stützen - wenn die Infrastruktur verbessert wird, wird die Arbeit auf der oberen Ebene effizienter; aber auch wenn die Infrastruktur nicht reif ist, beeinträchtigt dies nicht die Validierung der oberen Algorithmen.

Hard Kr: Was ist der Kernengpass der Hirn-ähnlichen Intelligenzroute? Ist es die Rechenleistung oder die ungelöste Theorie?

Zhu Senhua: Keines von beiden. Tatsächlich stammen viele Kernkonzepte, die in der heutigen KI-Branche alltäglich sind, einschließlich Neuronen, neuronaler Netze, Aufmerksamkeitsmechanismen und Weltmodellen, aus der Hirnwissenschaft. Mit jedem Schritt der Reife der Hirnwissenschaft kann die KI einen Schritt vorwärts gehen. Aber wir sehen auch, dass die KI bereits heute auf einem hohen Niveau steht, bevor die Hirnwissenschaft das menschliche Gehirn vollständig entschlüsselt hat. Also liegt der Engpass nicht darin, dass "die Theorie noch nicht reif ist, also kann man es nicht tun", und auch nicht

Dieser Artikel wurde ursprünglich von「黄楠」produziert， Für Nachdruck oder Inhaltszusammenarbeit klicken Sie bitte auf Hinweise zum Nachdruck ；Bei unbefugtem Nachdruck wird strafrechtlich verfolgt.

Huawei's Embodied Brain No. 1 is developing a brain-inspired intelligent world model, competing with JEPA, and has received hundreds of millions of yuan in financing | Exclusive Report by Yingke