StartseiteArtikel

Ein Doktor aus der Tsinghua-Universität aus der 90er-Jahrgangsstufe hat in einem Monat 5 Milliarden Yuan zugenommen.

铅笔道2026-04-16 08:22
Innerhalb eines Monats wurden zwei Runden von Finanzierungen abgeschlossen, und der Unternehmenswert stieg von 5 Milliarden Yuan auf über 10 Milliarden Yuan.

Einen Monat, zwei Runden Finanzierungen, die Unternehmensbewertung stieg von 5 Milliarden Yuan auf über 10 Milliarden Yuan – Jijia Vision wurde plötzlich von Kapitalgebern heiß begehrt.

Die Unternehmensbewertung stieg um 5 Milliarden Yuan in einem Monat. Laut Schätzungen von Pencil News DATA könnte dies das Fallbeispiel mit der schnellsten Bewertungssteigerung dieses Jahres (öffentlich bekannt) sein.

Und dahinter steckt ein derzeit sehr beliebtes Schlagwort: Weltmodell.

01

Wofür ist ein Weltmodell gut?

Am 13. April absolvierte Jijia Vision eine Serie-B-Finanzierung im dreistelligen Millionenbereich. Nur einen Monat nach der letzten Finanzierung von fast 1 Milliarde Yuan überstieg die Unternehmensbewertung 10 Milliarden Yuan.

Sein Gründer heißt Huang Guan, ein Doktor aus der Generation der 90er. Er absolvierte ein Bachelorstudium in Automatisierung an der Huazhong-Universität für Wissenschaft und Technologie, ein Masterstudium am chinesischen Akademie der Wissenschaften und promovierte an der Tsinghua-Universität.

Während seines Promotionsstudiums absolvierte er ein Praktikum am Microsoft Research Asia und hatte Kontakt mit Forschern wie He Kaiming und Sun Jian und beteiligte sich an frühen Forschungen zur Deep Learning.

Aber das Wichtigste war nicht sein akademischer Werdegang, sondern seine drei "Wahlentscheidungen".

Erstens setzte er auf "Maschinen sehen lassen".

Um 2016 begannen Deep Learning-Technologien sich zu entwickeln, und die ersten Anwendungen waren in der visuellen KI zu finden. Huang Guan trat Horizon Robotics bei und arbeitete an Gesichtserkennung und visueller Wahrnehmung.

Die KI in dieser Phase war im Wesentlichen einfach: Maschinen sollten "Bilder verstehen". Das Team erstellte Datensätze, nahm an Wettbewerben teil und belegte Spitzenplätze in Ranglisten. Wichtiger war, dass die KI erstmals aus der Theorie in die Praxis wechselte und begann, tatsächlich Arbeit zu verrichten.

Zweitens setzte er auf "Maschinen die Welt verstehen lassen".

Um 2019 begann die Branche zu erkennen, dass es nicht genügt, Bilder zu verstehen, sondern auch zu wissen, "wo sich etwas befindet und was passiert". Daher beteiligte er sich an der Gründung von Jizhi Robotics und arbeitete an autonomem Fahren, indem er das BEV-Modell einsetzte, um 2D-Bilder in eine 3D-Welt zu transformieren.

Einfach ausgedrückt, ging es nicht mehr nur darum, "ein Auto zu sehen", sondern auch zu wissen, "wo es sich befindet und wohin es fährt". Die KI begann von "Beschreiben von Bildern" zu "Verstehen von Raum" überzugehen.

Drittens wählte er einen noch schwierigeren Weg: Maschinen sollen "vorher nachdenken".

Im Jahr 2023 gründete er Jijia Vision und war nicht mehr zufrieden mit "Sehen" und "Verstehen", sondern wollte, dass Maschinen vor dem Eintreten eines Ereignisses in ihrem "Gedächtnis" durchspielen, was passieren könnte.

Er nannte dies "Weltmodell", was man sich als "Maschinen mit Vorstellungskraft ausstatten" vorstellen kann.

In den letzten Jahren hat die KI immer besser geredet, aber noch nicht richtig gehandelt.

Schreiben von Artikeln, Code schreiben, Kundenservice leisten – all diese Dinge haben eines gemeinsam: Sie finden auf dem Bildschirm statt. Sobald man die KI in die reale Welt setzt, "weiß sie nicht mehr, was zu tun ist".

Zum Beispiel, wenn man einem Roboter sagt, eine Tasse aufzunehmen. Für Menschen ist dies einfach, aber für Maschinen müssen viele Fragen beantwortet werden: Wie schwer ist die Tasse? Rutscht sie? Wie soll die Hand positioniert werden? Soll der Vorgang unterbrochen werden, wenn jemand vorbeikommt?

Und der Schlüssel zur Lösung dieser Probleme ist das Weltmodell.

Jijia Vision hat auch sein eigenes Robotermodell vorgestellt, das nur den Oberkörper in menschlicher Form hat.

02

Wer verdient schon Geld? Mehrere Gruppen von Akteuren

Aber die Frage ist: Wer verdient schon Geld auf diesem Marktsegment? Die Antwort ist etwas überraschend: Es sind nicht diejenigen, die an Weltmodellen arbeiten, die zuerst Geld verdienen.

Die ersten, die Geld verdienen, sind Unternehmen im Bereich autonomes Fahren. Beispiele: Li Auto, Tesla.

Zum Beispiel Li Auto: Im Jahr 2025 beliefen sich die Einnahmen auf etwa 112,3 Milliarden Yuan und der Nettogewinn auf etwa 1,1 Milliarden Yuan.

Warum verdienen sie Geld? Weil das Weltmodell direkt einen Kernindikator beeinflusst: Ist das autonome Fahren "sicherer und menschlicher"?

Nehmen wir das gleiche Szenario: Eine Person steht am Straßenrand. Ein herkömmliches Algorithmus kann nur erkennen: "Das ist eine Person". Aber ein Weltmodell geht einen Schritt weiter: Wird diese Person auf die Straße laufen? Wohin wird sie gehen? Soll ich bremsen?

Diese Fähigkeit entscheidet direkt darüber, ob die Benutzer das System nutzen und dafür bezahlen wollen.

Deshalb sehen wir, dass das autonome Fahren von einem "Erkennungs-Wettbewerb" zu einem "Vorhersagefähigkeits-Wettbewerb" wird. Automobilhersteller konkurrieren darum, "wie ein erfahrener Fahrer" zu sein.

Das Geld wird aus der Prämie für Ganzfahrzeuge und intelligentes Fahren verdient.

Nehmen wir Li Auto als Beispiel: Die hochwertige Version mit intelligenter Fahrassistenz bringt in der Regel eine Nettoprämie von etwa 10.000 Yuan. Wenn das Unternehmen Hunderttausende von Fahrzeugen pro Jahr verkauft, belaufen sich diese "durch intelligente Fähigkeiten bestimmte Einnahmen" auf mehrere Milliarden Yuan.

Die zweite Gruppe, die Geld verdient, sind Unternehmen im Bereich Rechenleistung und Infrastruktur. Beispielunternehmen: NVIDIA.

Wenn Unternehmen im Bereich autonomes Fahren "Geld mit Ganzfahrzeugen" verdienen, verdient diese Gruppe direktes Geld: Geld mit Rechenleistung.

Der Grund ist einfach: Weltmodelle sind "schwerer" als große Sprachmodelle. Sie müssen gleichzeitig Raum (3D), Zeit (dynamische Veränderungen), Multimodularität (Bilder + Sensoren) verarbeiten, und die Trainingskosten sind viel höher als bei normalen großen Modellen.

Das Ergebnis ist: Wer Rechenleistung verkauft, verdient zuerst Geld. Deshalb sagt Jensen Huang, dass, wenn Weltmodelle erfolgreich umgesetzt werden können, der Marktpotenzial bis zu 100 Billionen US-Dollar betragen könnte.

Im Jahr 2025 veröffentlichte NVIDIA eine sehr beeindruckende Bilanz: Jahresumsatz von über 130 Milliarden US-Dollar (über 900 Milliarden Yuan), Nettogewinn von über 70 Milliarden US-Dollar und eine Rendite von etwa 55%.

Rechenleistung ist das "Schaufelgeschäft" hinter Weltmodellen.

Die dritte Gruppe, die sich langsam dem Gewinn erzielen nähert, sind Unternehmen, die "Weltmodellplattformen" anbieten.

Was verkaufen diese Unternehmen? Die meisten verkaufen nicht direkt Roboter (außer Jijia Vision) oder Autos, sondern die Fähigkeit, "Maschinen denken zu lassen", einschließlich: Simulationssysteme für autonomes Fahren, Trainingsplattformen für Roboter, Generierung von Daten aus der realen Welt usw.

Ihr Geschäftsmodell beginnt sich zu formen:

1. Verkauf von Software (Simulationssysteme).

Wiederherstellung der realen Welt in einer virtuellen Umgebung. Der Preis für ein System liegt zwischen 5 Millionen und 30 Millionen Yuan pro Jahr.

2. Verkauf von Dienstleistungen (Training + Optimierung).

Unterstützung von Unternehmen bei der Entwicklung von Modellen für autonomes Fahren oder Roboter. Die Gebühren für ein einzelnes Projekt betragen zwischen 10 Millionen und 50 Millionen Yuan.

3. Verkauf von Daten (hochwertige Szenarien).

Angebot von hochwertigen Szenariodaten (extreme Straßenbedingungen, komplexe Interaktionen). Der Preis für ein einzelnes Datenset liegt zwischen Hunderttausenden und Millionen Yuan.

Aber diese Gruppe von Unternehmen hat ein gemeinsames Merkmal: Die Kommerzialisierung ist noch nicht vollständig abgeschlossen.

Insgesamt befinden sich die meisten Unternehmen, die an "Weltmodellen" arbeiten, noch in der Investitionsphase. Denn dies ist sehr schwierig und teuer.

1. Schwierigkeiten bei der Datenerfassung: Die Kosten für die Erfassung von Daten aus der realen Welt sind extrem hoch.

2. Komplexes System: Chips, Sensoren, Modelle und Steuerungssysteme sind eng miteinander verzahnt.

3. Hoher Rechenleistungsverbrauch: Die Trainingskosten sind viel höher als bei großen Sprachmodellen.

Aber je schwieriger die Aufgabe, desto größer ist möglicherweise der Marktpotenzial.

Laut einem Bericht von MarketsandMarkets vom April 2026 wird der globale Markt für physische KI (mit Weltmodellen als Kerntechnologie) voraussichtlich von 1,5 Milliarden US-Dollar im Jahr 2026 auf 15,2 Milliarden US-Dollar im Jahr 2032 wachsen, was einem durchschnittlichen jährlichen Wachstum von 47,2% entspricht.

03

Es gibt viel Geld, und das Kapital ist heiß

Obwohl die meisten Unternehmen noch nicht gewinnbringend sind, ist das Faktum dieses Jahres: Die Finanzierungen sind heiß, und das Kapital fließt in die Branche.

Jijia Vision ist ein typisches Beispiel.

Im März 2026 absolvierte es eine Serie-Pre-B-Finanzierung von fast 1 Milliarde Yuan, und die Unternehmensbewertung belief sich auf 5 Milliarden Yuan. Einen Monat später absolvierte es eine Serie-B-Finanzierung im dreistelligen Millionenbereich, und die Unternehmensbewertung stieg über 10 Milliarden Yuan.

Der Primärmarkt ist derzeit eher kalt, und die Finanzierungszyklen für viele KI-Projekte werden immer länger. Unter diesen Umständen zeigt das "zwei Runden Finanzierungen in einem Monat und Verdoppelung der Unternehmensbewertung" bereits, dass das Weltmodell die Phase des "Geschichtenerzählens" hinter sich gelassen hat und in die Phase des "Kapitalbeschaffens" eingetreten ist.

Was noch bemerkenswerter ist, ist, dass nicht nur Finanzinvestoren, sondern auch Industriekapitalgeber wie Huawei Hubble, SMIC Juyuan und lokale staatliche Investitionskapitalgeber in das Weltmodell investieren.

Dies bedeutet, dass das Weltmodell nicht mehr nur eine technologische Richtung ist, sondern als zukünftige industrielle Infrastruktur angesehen wird.

Diese Veränderung ist global. Im ersten Quartal 2026 hat sich die Finanzierung von Weltmodellen weltweit deutlich beschleunigt.

In den USA hat World Labs von Fei-Fei Li über 1 Milliarde US-Dollar an Finanzierungen erhalten, und das neue KI-Architekturprojekt von Yann LeCun hat ebenfalls eine riesige Finanzierung erhalten. In China gibt es immer noch Unterschiede bei den Einzelbeträgen, aber die Anzahl der Projekte hat zugenommen – im ersten Quartal dieses Jahres gab es über 20 Finanzierungen, die von einigen Millionen bis zu einigen Hundert Millionen Yuan reichten.

Aber wichtiger als die Finanzierung ist, dass die Weltmodelle zunehmend in die Praxis umgesetzt werden.

Nehmen wir das autonome Fahren als Beispiel: Mit Weltmodellen kann man vorhersagen, ob eine Person auf die Straße laufen wird und wohin sie gehen wird.

Jijia Vision hat bereits mit etwa 20 Automobilherstellern zusammengearbeitet und Weltmodelle in Szenarien wie komplexen Kreuzungen und Fußgängereinschätzungen eingesetzt. Andere Unternehmen nutzen Weltmodelle für das Greifen und Sortieren von Gegenständen durch Roboter oder bauen Simulationsplattformen, um die Trainingskosten auf ein Zehntel zu reduzieren.

Zur gleichen Zeit beginnt die Branche sich zu differenzieren. Ein kleiner Teil der Unternehmen kann kontinuierlich Finanzierungen erhalten und ein komplettes technologisches System aufbauen; die meisten Unternehmen bleiben auf einem bestimmten Gebiet stehen; und einige werden schnell eliminiert.

Die Einstellung der Kapitalgeber ändert sich auch: Von "nicht verstehen" zu "probieren" und schließlich zu "konzentriert auf die Spitzenunternehmen setzen". Das Geld wird nicht mehr gleichmäßig verteilt, sondern sammelt sich schnell bei wenigen Projekten.

Gesamtbetrachtet befindet sich der Weltmodellmarkt im Jahr 2026 in der "frühen Konvergenzphase": Der technologische Weg ist noch nicht einheitlich, aber die Hauptrichtungen sind erkennbar; die Kommerzialisierung befindet sich noch in der Anfangsphase, aber die Anwendungsfälle werden immer deutlicher; es gibt viele Akteure, aber die Spitzenunternehmen beginnen sich abzuheben.

Im nächsten Schritt wird nicht mehr davon abhängen, wer die modernsten Ideen hat, sondern davon, wer am schnellsten seine Fähigkeiten in Produkte umsetzen und diese in der realen Welt einsetzen kann.

Dieser Artikel stellt keine Anlageempfehlung dar.

Dieser Artikel stammt aus dem WeChat-Account