Eine neue Finanzierungsrunde im Wert von mehreren hundert Millionen Yuan abgeschlossen – Yingmou Technology Hyper3D läutet das „Zeitalter des Denkens“ für die 3D-Generierung ein | Exklusiv von 36Kr
Text | Wang Xinyi
Redaktion | Zhang Yuxin
Seit Beginn des Jahres 2026 ist die Branche der 3D-Generierungsmodelle ziemlich belebt.
Im ersten Quartal dieses Jahres hat Yingmou Technology das erste 3D-Bearbeitungsmodell Rodin Gen-2 Edit veröffentlicht, wodurch es erstmals möglich wurde, AI-3D-Modelle zu bearbeiten. Im Juni dieses Jahres hat VAST die Ankündigung einer neuen Runde von Finanzierungen gemacht, und Meshy hat daraufhin claimed to have released the world's first 3D AI Agent.
In letzter Zeit hat Yingmou Technology – dieses junge 3D-Modellteam, das tief in der akademischen Welt verwurzelt ist und früh ins Unternehmertum eingestiegen ist – mit seinen neuesten technologischen Forschungsergebnissen und einer neuen Runde von Finanzierungen erneut Feuer hinzugeworfen.
Dieses Team wurde im Jahr 2020 gegründet. Der Gründer und CEO Wu Di, der Mitgründer und CTO Zhang Qixuan sowie die anderen beiden Mitgründer Zhang Longwen und Zeng Chuxiao stammen alle von der Shanghai University of Science and Technology. Das Team besteht aus etwa 60 Personen, deren Durchschnittsalter unter 25 Jahren liegt.
Obwohl es jung aussieht, hat Yingmou in der B2B-Marke fast die Spitzenposition erreicht. Die Anzahl seiner B2B-Kunden und das Einnahmenvolumen sind höher als die Summe aller anderen Unternehmen in der Branche. Zu seinen Kunden gehören Unternehmen wie ByteDance, Unity, Figma und Canva. Etwa 80 % der Gesamtumsätze stammen aus dem Ausland.
Die Entwicklung des nativen 3D-Generierungskonzepts CLAY, das die Haupt-Architektur von AI-3D definiert, und die mehrjährigen Erfolge bei der Gewinnung der besten Artikel und Nominierungen auf der renommierten Computergrafik-Konferenz SIGGRAPH – in Bezug auf akademische Errungenschaften ist das Forschungsprofil von Yingmou auch ziemlich beeindruckend. Es gibt ständig Artikel und Preise in Top-Zeitschriften und auf verschiedenen Konferenzen. Bei jedem zweiten Mitarbeiter des Algorithmus-Teams wurde ein bester Artikel gewonnen oder nominiert.
Nach exklusiven Informationen von "Intelligent Emergence" hat Yingmou Technology in letzter Zeit die Ankündigung einer neuen Runde von Finanzierungen in Höhe von mehreren Hundert Millionen Yuan gemacht. Diese Runde von Finanzierungen wird von Cathay Capital und Shanghai Guotou Leading Investment angeführt, und die alten Aktionäre setzen weiterhin ihre Investitionen fort. Zuvor haben ByteDance, Meituan Longzhu, Sequoia und BlueRun Ventures bereits nacheinander investiert.
Im Zuge der neuen Runde von Finanzierungen hat Yingmou Technology das neueste 3D-Generierungsmodell – Hyper3D Rodin Gen-2.5 – veröffentlicht, das das Muster der Sprachmodelle "zuerst denken, dann generieren" in den Bereich der 3D-Generierung eingeführt hat. Für verschiedene Produktionsszenarien bietet Gen-2.5 ein einstellbares Genauigkeitsmodell. Dieses Modell ist das weltweit erste 3D-Generierungsmodell mit einer Million Polygonen. Es kann in nur 4 Sekunden ein Modell mit einer Million Polygonen generieren und hat gleichzeitig das weltweit erste native 3D-Texturmodell mit einer Genauigkeit von 12K vorgestellt.
Seit langem bietet Yingmou für die B2B- und die professionelle C2C-Marke Dienstleistungen wie Plattform-Abonnements, Verkauf von B2B-APIs, private Bereitstellungen und die direkte Bereitstellung von Endprodukten an. Die Hauptanwendungsgebiete umfassen Branchen wie E-Commerce, 3D-Druck, Spiele, industrielle Gestaltung und Embodied AI.
Angesichts des Wettbewerbs auf dem Markt setzt Yingmou auf den Auslandsmarkt, die professionellen C2C-Nutzer und die bessere Kontrollierbarkeit des Generierungsprozesses der Modelle.
Es ist bemerkenswert, dass nach der Veröffentlichung des neuen Modells Rodin Gen-2.5 die C2C-Einnahmen die B2B-Einnahmen überholen. Im ersten Monat nach dem Start von Rodin Gen-2.5 hat sowohl die Anzahl der Abonnenten als auch die ARR um mehr als 400 % im Vergleich zum Vorherigen Monat zugenommen.
Der Fokus auf die C2C-Marke trifft genau das Problem, das Yingmou lösen möchte: Kann AI-3D tatsächlich von den Nutzern verwendet werden?
"Menschen, die aus der akademischen Welt kommen, neigen dazu, zu denken, dass ihre Technologie und ihre Artikel sehr gut sind und fragen sich, warum der Markt sie nicht nutzt. Aber in der Realität besteht eine enorme Kluft zwischen dem, was in der Laborforschung entwickelt wird, und dem, was tatsächlich verwendet werden kann." sagte Wu Di uns.
Um diese Kluft zu überbrücken, ist es wichtig, dass die generierten Modelle den Nutzungsstandards entsprechen und die Nutzer das Ergebnis der 3D-Generierung kontrollieren können.
Dafür geben sie den Nutzern fast maximale Freiheit bei der Bearbeitung.
Auf der Plattform können die Nutzer über das selbst entwickelte 3D ControlNet von Yingmou die Länge, Breite und Höhe sowie die Form des generierten Ergebnisses kontrollieren. Sie können die 3D-Bearbeitungsfunktion nutzen, um sowohl die von der Plattform generierten Modelle als auch Drittanbieter-Modelle zu bearbeiten. Die Plattform unterstützt die lokale Änderung von Modellen mit natürlicher Sprache. Sie können 3D-Assets in Teile aufteilen und auch nach der Aufteilung weiter aufteilen.
△ Die Fähigkeit von Yingmou Technology, 3D-Assets in Teile aufzuteilen, Quelle: Unternehmensoffiziell
Nach Ansicht von Yingmou ist genau dieser scheinbar komplizierte und von den Nutzern wiederholt zu bestätigende und zu kontrollierende Prozess der Grund, warum die Nutzer sie wählen.
"Wir haben eine Einschätzung der Nutzergruppe für die 3D-Generierung gemacht. Die meisten Nutzer, die bereit sind, zu zahlen, sind genau diejenigen, die an 'Kontrollierbarkeit' interessiert sind. Wir müssen zuerst diejenigen bedienen, die tatsächlich zahlen werden." sagte Zhang Qixuan. "Die praktische Anwendung der 3D-Generierung hat sich von der Wertschätzung der optischen Qualität hin zu einer Balance zwischen Kontrollierbarkeit, Effizienz und Qualität entwickelt. Wir befinden uns nun in der zweiten Hälfte, die näher an der realen Produktion liegt."
Die Kontrollierbarkeit des Modells bereits in der Vor-Trainingsphase gestalten
Nach dem Rückgang der Metaverse-Branche und der Finanzschwierigkeiten im Jahr 2023 hat die Forschung und die Entwicklung des nativen 3D-Generierungskonzepts CLAY im Jahr 2024 die Richtung von Yingmou Technology und sogar der gesamten 3D-Generierungsbranche völlig verändert.
Damals folgte fast alle technischen Ansätze in der gesamten AI-3D-Branche dem Muster "2D zu 3D". Zuerst werden mehrperspektivische Bilder eines Objekts erzeugt, und dann wird daraus ein 3D-Asset modelliert. Dieser Ansatz hat deutliche Nachteile: Es gibt eine irreversible Informationsverlust, und die generierten Modelle sind schwerlich in der industriellen Gestaltung, Spielen und anderen verwandten Bereichen anwendbar.
Aber Yingmou glaubt, dass es wichtiger ist, dass die generierten 3D-Assets "Production-Ready" (produktionsbereit) sind. Deshalb haben sie eine gegen die herrschende Meinung gerichtete Entscheidung getroffen: Sie trainieren ein natives 3D-Modell von Grund auf mit 3D-Daten.
Diesen Weg, den noch niemand gegangen ist, haben sie erfolgreich beschritten.
Im Jahr 2024 hat das Yingmou-Team das weltweit erste produktive native 3D-Großmodell-Framework CLAY ("CLAY: A Controllable Large-Scale Generation Model for Creating High-Quality 3D Assets") vorgestellt. Durch die Innovation auf der Ebene der Algorithmen und des Frameworks haben sie die Effektivität der 3D-Generierung von unbrauchbar auf brauchbar verbessert. Diese Forschung wurde für den besten Artikel der SIGGRAPH in diesem Jahr nominiert.
Im Mittelpunkt des gleichen Jahres hat Yingmou Technology auf der Grundlage der CLAY-Architektur das weltweit erste native 3D-Modell Rodin Gen-1 veröffentlicht. Dies hat auch die Hauptauswahl der technischen Route in der Branche verändert, und viele Unternehmen haben sich nun der nativen Route der 3D-Generierung zugewandt.
Die beiden wichtigsten Anforderungen von Yingmou an ihre 3D-Modelle sind: Kontrollierbarkeit und Qualität.
Die Kontrollierbarkeit ist eine offene Karte von Yingmou. "Für professionelle Gestalter ist die Kontrollierbarkeit besonders wichtig. Dies ist der Hauptgrund, warum sie uns wählen." sagte Zhang Qixuan.
"Der Schlüssel zur Erreichung der Kontrollierbarkeit liegt darin, die entsprechende Gestaltung bereits in der Vor-Trainingsphase einzubauen und sie zusammen mit der Basis des Modells zu entwickeln." Seit der ersten Version von Rodin haben sie die kontrollierbaren Fähigkeiten wie 3D ControlNet eingeführt.
Seitdem hat das Yingmou-Team auch die Kontrollierbarkeit des Produkts kontinuierlich verbessert. Dies umfasst die Unterstützung der lokalen Änderung von Modellen, die automatische Aufteilung in verschiedene Teile und die Möglichkeit, die Teile weiter aufzuteilen. Dies hilft den Nutzern, die Anzahl der Ziehungen zu reduzieren und die Kontrollierbarkeit während des Generierungsprozesses der Modelle zu verbessern.
Rodin Gen-2.5 hat erstmals in der 3D-Generierungsbranche eine Strategie ähnlich der "Test-time Scaling" (Skalierung zur Testzeit) von LLM (Große Sprachmodelle) eingeführt. Die adaptive einstellbare "Thinking Effort" (Denkanstrengung) eröffnet die Möglichkeit für eine tiefgreifende Integration mit LLM in Zukunft, ähnlich wie bei Bildgenerierungsmodellen. Über diese Strategie können die Nutzer die Denkzeit und -tiefe des Modells auswählen. Es unterstützt fünf Stufen der Denktiefe, die zwischen 4 und 80 Sekunden dauern und von einem schnellen Entwurf bis zu einem hochpräzisen Asset reichen. Im "Extreme-High"-Modus kann das Modell eine Generierungsfähigkeit von einer Million Polygonen erreichen und Mikrostrukturen, Texturen und Poren der Haut wiedergeben.
△ Die fünf Stufen der Denktiefe von Rodin-2.5, Quelle: Unternehmensoffiziell
Darüber hinaus hat Yingmou auch ein natives 3D-Texturmodell vorgestellt. Im Gegensatz zur traditionellen Projektionsmethode zur Erzeugung von Materialien kann dieses Modell Probleme wie Farbunterbrechungen und Färbungen der traditionellen Methode lösen und Informationen wie Logos und Texte klar beibehalten. Vom geometrischen Erzeugen bis zur Texturierung dauert es nur 5 Sekunden.
Dieses Texturmodell hat die Fähigkeit auf dem Niveau der Bildgenerierung. Es kann die Materialtextur allseitig abdecken, die Texteffekte deutlich verbessern und unterstützt PBR-Materialien auf physikalischer Basis. Zusammen mit dem synchron vorgestellten 12K-nativen 3D-Texturmodell kann die Generierungseffektivität in Bezug auf geometrische Genauigkeit und Materialtreue die Ergebnisse der realen Szeneriescans übertreffen und ist um Generationen vor der Branche.
Der andere Schlüsselpunkt – die Qualität – hat Yingmou mit einer Reihe von Forschungsergebnissen bewiesen.
Nach CLAY haben sie nacheinander Forschungsergebnisse wie CAST und BANG vorgestellt. Das erste kann durch die Eingabe eines Bildes eine vollständige 3D-Szene mit Objekten und deren Beziehungen generieren. Das zweite kann die Aufteilung von 3D-Assets ermöglichen.
Der Forschungsartikel über CAST ("CAST: Component-Aligned 3D Scene Reconstruction from a Single RGB Image") hat den Preis für den besten Artikel der SIGGRAPH 2025 gewonnen. In derselben Zeit waren nur Google, Meta und Yingmou die kommerziellen Unternehmen, die in diesem Bereich den besten Artikel gewonnen haben.
Als einziges kommerzielles Unternehmen, das mehrere Jahre nacheinander den besten Artikel und Nominierungen auf der SIGGRAPH gewonnen hat, hat Yingmou seit 2020 mehr als 30 Artikel auf renommierten akademischen Konferenzen und in Zeitschriften veröffentlicht. Etwa 70 % dieser Forschungsergebnisse sind in die Praxis umgesetzt worden.
Dies zeigt sich konkret in der Iteration der Produkte. In den letzten zwei Jahren hat Yingmou vier wichtige Iterationen der Modelle vorgenommen, von Rodin Gen-1, Rodin Gen-2, das im September 2025 mit der Fähigkeit zur Aufteilung in Teile veröffentlicht wurde, Rodin Gen-2 Edit, das im Januar 2026 mit der lokalen Bearbeitungsfunktion veröffentlicht wurde, bis hin zu Rodin Gen-2.5, das im Juni dieses Jahres neu veröffentlicht wurde.
Bezüglich der Zukunft von AI-3D sagte Wu Di uns, dass das Unternehmen in den nächsten ein bis zwei Jahren zwei Dinge tun wird. Erstens wird es die Generierungsqualität des Basis-Modells verbessern. Zweitens wird es die Fähigkeiten wie Bearbeitung und Agentisierung erweitern, um das Modell in den professionellen Bereichen immer nützlicher zu machen.
Den professionellsten Nutzern dienen und die realsten Probleme lösen
Der kommerzielle Weg von AI-3D wird noch von der Branche validiert, aber nach Ansicht von Yingmou ist dies ein nachhaltiges und gutes Geschäft.
Betrachtet man nur die Rechenleistungskosten für das Modelltraining, so erfordert die Iteration des ganzzahligen Vielfachen-Modells von Rodin ein Training mit Tausenden von Karten. Aber aufgrund der eigenen Akkumulation in der Algorithmus-Architektur von Yingmou ist die Trainings-effizienz im Vergleich zu den Konkurrenten bei der Erstellung eines Modells auf demselben Niveau erheblich verbessert.
In letzter Zeit stellt die Qualität und Nachhaltigkeit der Unternehmens-Einnahmen (B2B) allmählich die Anzahl der Verbraucher-Nutzer als die Kern-Dimension zur Messung des langfristigen Werts von AI-Unternehmen dar – Die Unternehmens-Route, repräsentiert durch Anthropic, wird allgemein als typisches Beispiel für diesen Trend angesehen.
Zur gleichen Zeit verfolgt Yingmou auf der Einnahme-Seite eine ähnliche Unternehmens-Route wie Anthropic. Die Einnahmen aus seinen B2B-Kunden überschreiten die Summe aller anderen Unternehmen in der gleichen Branche.
Aus Sicht der Kunden verteilen sich die B2B-Aufträge von Yingmou auf verschiedene hochwertige Szenarien wie Spiele, E-Commerce, industrielle Gestaltung, Embodied AI und Raumrechnung. Gleichzeitig sind die C2C-Kunden hauptsächlich "Pro-C" (professionelle Verbraucher), wie Modellierer, 3D-Druck-Enthusiasten und Produkt-Designer.
Nach Ansicht des Yingmou-Teams wird die 3D-Generierung in den nächsten 3 - 5 Jahren hauptsächlich von professionellen Nutzern verwendet. Es ist schwierig, zwischen Sprachmodellen,