StartseiteArtikel

Ehemalige Xiaomi-Manager gründen ein Startup im Bereich Robotik und wenden die "Logik der Blockbusterprodukte" auf die industrielle universelle Embodied AI an.

富充2026-03-03 10:25
Xiaoyu Zhizao schätzt, dass die Nachfrage nach intelligenten Schweißrobotern auf die Größenordnung von zehn Millionen Geräten steigen könnte. Wenn man nur 10 % des Marktes einnehmen kann, erfüllt das Produkt vollkommen die Marktbedingungen, um ein "Hitschlager" zu werden.

Text | Fu Chong

Redaktion | Su Jianxun

Qiao Zhongliang, der Gründer von Xiaoyu Zhizao, hat die typischen Eigenschaften eines "Xiaomi-Szene" Entrepreneurs im Bereich der Embodied AI: Er ist gut darin, Anwendungsfälle zu finden und hat einen sehr praktischen Ansatz für die Kommerzialisierung.

Seit seiner Gründung im Februar 2023 hat Xiaoyu Zhizao sich das Ziel gesetzt, "industrielle universelle Embodied AI" zu entwickeln. Der Schweißroboter als erstes Produkt im Sinne des "Eierlegenden Wollmilchsau" Konzepts wird im vierten Quartal 2025 in die Produktionslinien der Kunden integriert.

Nach seinem Masterabschluss in Informatik an der Beihang Universität im Jahr 2010 trat Qiao Zhongliang in die Gründungsphase von Xiaomi ein und wurde der erste Frischling bei Xiaomi. Bei seiner Abreise war er bereits fünf Jahre lang Leiter der MIUI-Entwicklung bei Xiaomi und hielt den Rekord für die schnellste Beförderung von einem Frischling zum Generalmanager bei Xiaomi.

Während seiner 13-jährigen Zeit bei Xiaomi war Qiao Zhongliang an der Entwicklung und Iteration des Mobilfunksystems und der MIUI von Grund auf beteiligt und leitete die Softwarearchitekturumstellung hin zu "Einmal entwickeln, auf mehreren Endgeräten deployen", sodass dasselbe System auf Mobiltelefonen, Smartwatches, Fernsehgeräten und anderen Endgeräten eingesetzt werden kann.

Diese Erfahrungen haben Qiao Zhongliang mit dem Erfahrungsschatz in der Integration von großen skalierbaren Hard- und Software-Systemen ausgestattet und ihn auch zu einer fast zwanghaften Haltung in Bezug auf die "Universellität" veranlasst: Es sollen intelligente Produkte entwickelt werden, deren zugrunde liegende Logik wiederverwendet werden kann. Einfacher ausgedrückt: Anstatt für jedes Gerät einen eigenen "Gehirn" zu entwickeln, soll ein universelles "Gehirn" geschaffen werden, das verschiedene Hardware-"Körper" steuern kann.

Mit diesem Gedanken gründete Qiao Zhongliang Xiaoyu Zhizao mit dem Ziel, "ein Gehirn, viele Formen" zu realisieren: Ein multimodales Embodied AI-Gehirn soll Roboter in verschiedenen Formen wie Einarmrobotern, zweiachsigen Radrobotern und humanoiden Robotern steuern.

"Allerdings muss zunächst sichergestellt werden, dass dieses 'Supergehirn' einen kommerziellen Anwendungsfall findet, der dauerhaft profitabel ist und in dem die Datenflüsse reibungslos funktionieren." Qiao Zhongliang schätzt auf Grundlage des aktuellen Algorithmusentwicklungsprozesses, dass, sobald das "ein Gehirn, eine Form" Konzept in einem Anwendungsfall erfolgreich umgesetzt werden kann, die Schwierigkeit der Anpassung an verschiedene Roboterformen auf etwa 10% sinken wird.

Um passende Anwendungsfälle zu finden, hat Qiao Zhongliang zu Beginn der Gründung umfangreiche Marktanalysen durchgeführt. Er hat drei Regeln für die Auswahl von Anwendungsfällen für die Roboter von Xiaoyu Zhizao zusammengefasst: Sie sollen Aufgaben übernehmen, die Menschen nicht gerne tun, die Menschen lange Zeit brauchen, um zu lernen, und die einen hohen Mehrwert bieten.

Mit diesen drei Kriterien hat Qiao Zhongliang eine einfache Methode angewandt - er hat bei der Menschenrechts- und Sozialministeriums nach den Berufen mit den größten Personalengpässen gefragt. Dabei hat er festgestellt, dass der Bedarf an Schweißern allein auf nationaler Ebene auf über 10 Millionen Arbeitskräfte geschätzt wird, von denen allein 2 Millionen für die Gaschutzschweißung benötigt werden. Das macht den Schweißerberuf zu dem Beruf mit dem größten Personalengpass.

Nach Besuchen in Schiffswerften, Baustellen und Schwerindustrieunternehmen hat Qiao Zhongliang festgestellt, dass Schweißarbeiten schädlich für die Lunge, die Augen und die Wirbelsäule sind und dass die Schulungszeit bis zu ein bis zwei Jahren dauert. Deshalb sind junge Menschen trotz eines durchschnittlichen monatlichen Einkommens von über 10.000 Yuan wenig an diesem Beruf interessiert.

Noch wichtiger ist, dass Schweißen einer der komplexesten Anwendungsfälle mit physikalischer Rückkopplung ist. Die Dynamik der Schmelze, die Schrumpfung und Expansion des Metalls, die Störungen durch Rauch und Staub... alle zusammen bilden eine Umgebung mit einer enormen Menge an Informationen und einer Vielzahl von Variablen. Qiao Zhongliangs Einschätzung ist, dass, wenn das universelle Gehirn in der Schweißanwendung die physikalische Schleife von "genau sehen, richtig positionieren und stabil steuern" erfolgreich umsetzen kann, dann bei der Übertragung auf andere Roboterformen hauptsächlich die Unterschiede in der Kinematik und der Sensorperspektive berücksichtigt werden müssen.

Nach der Festlegung auf die Schweißanwendung hat Qiao Zhongliang die "Hits" -Methodik, die er bei Xiaomi erlernt hat, auf den B2B-Bereich übertragen: Der Kern besteht darin, das Produkt unter Beibehaltung der Benutzererfahrung und der Stabilität aufs Extrem zu bringen. Dazu wählt Xiaoyu Zhizao für die Kernkomponenten der Roboter erstklassige Zulieferer, verteilt aber die Entwicklungskosten durch die Massenproduktion.

Xiaoyu Zhizao schätzt, dass der Bedarf an intelligenten Schweißrobotern im Bereich von Tausenden von Millionen Geräten liegen könnte. Wenn das Unternehmen nur 10% des Marktes erobern kann, hat es vollkommen die Marktbedingungen, um ein "Hitprodukt" zu werden. Seit dem vierten Quartal 2025 werden die von der Firma entwickelten Schweißroboter in die Fabriken der Kunden eingesetzt, und es gibt bereits mehrere hundert Interessenten.

In Bezug auf die technische Route folgt Xiaoyu Zhizao der von Tesla FSD validierten Route: End-to-End, datengesteuert. Ähnlich wie bei der autonomen Fahrweise wird bei der Schweißanwendung ein Roboter gesteuert, um feinfühlige Manipulationen auszuführen. Der Schwerpunkt liegt jedoch darin, "wie die letzten Millimeter des Schweißvorgangs richtig positioniert werden können".

Dazu verwendet das Unternehmen ein datengesteuertes, natives multimodales 3D-Weltmodell: Im Pre-Training-Stadium werden simulierte Daten mit realen Maßen verwendet, während im Post-Training-Stadium eine große Menge an hochpräzisen Sensordaten aus industriellen Anwendungen eingesetzt werden, um ein Basis-Modell mit der Fähigkeit zur physikalischen Maßeinschätzung zu erhalten.

Aber das Schweißen ist nur der Anfang. Qiao Zhongliang skizziert eine zukünftige Vision in Form einer "Fächererweiterung": Von der Schweißanwendung ausgehend, soll ein "Stützpunkt" geschaffen und ausreichend Cashflow generiert werden, bevor sich die Firma in die Nachbarbereiche wie Nieten, Schleifen und Lackieren ausdehnt. Die Anwendungsfälle sollen die Schwerindustrie, die Automobilindustrie und die Konsumelektronik abdecken. Nachdem die Schweißanwendung erfolgreich umgesetzt wurde, plant er, ein Branchen-Ökosystem aufzubauen, Lösungsprovider zu fördern und die Lieferketten, die Vertriebskanäle und die Marke wiederzuverwenden, um gemeinsam eine Datenplattform und Basis-Fähigkeiten aufzubauen. Qiao Zhongliang nennt diese Strategie "Einheitsfront", die im Wesentlichen darauf basiert, durch Investitionen und Partnerschaften die Fähigkeiten an anderen Stellen zu replizieren und das Geschäftsgebiet zu erweitern.

In jüngster Zeit hat "Intelligent Emergence" ausschließlich erfahren, dass Xiaoyu Zhizao eine Serie B Finanzierung abgeschlossen hat. Diese Finanzierung wurde von Huaye Tiancheng als Lead-Investor durchgeführt, während China Merchants Bank International, Maotai Fund und Guizhou Provincial Science and Technology Innovation Angel Fund als Mit-Investoren beteiligt waren. Die alten Anleger Didi und Li Wanqiang, Mitbegründer von Xiaomi, haben ihre Investitionen erhöht. Seit ihrer Gründung hat Xiaoyu Zhizao auch Investitionen von renommierten Institutionen wie iFlytek und Beijing Information Industry Investment Fund erhalten.

Im Folgenden finden Sie das Interview von "Intelligent Emergence" mit Qiao Zhongliang, das vom Autor bearbeitet wurde:

△ Qiao Zhongliang, Gründer von Xiaoyu Zhizao, Foto: Interviewer 

"Ein Gehirn, viele Formen" und Fächererweiterung

Intelligent Emergence: Xiaoyu Zhizao möchte "ein Gehirn, viele Formen" für Schweißroboter realisieren. Wie sieht das aktuelle Produkt aus? Es ist bereits schwierig, "ein Gehirn, eine Form" zu kontrollieren. Wie kann man dann "ein Gehirn, viele Formen" erreichen?

Qiao Zhongliang: Unser Ansatz bei "ein Gehirn, viele Formen" besteht darin, zunächst das "Gehirn" zu trainieren und es dann an verschiedene "Formen" anzupassen. Wir glauben, dass in der industriellen Anwendung nicht aufwendige "Regelwerke" benötigt werden, sondern ein "universelles Gehirn", das sich selbst weiterentwickeln kann.

Konkret haben unsere Roboter alle die Kernkomponenten "Hand, Auge, Gehirn", d. h. eine Kombination aus Arm, Kamera und Gehirn-Modell. Unser derzeitiges Hauptprodukt ist ein Einarmroboter + Kamera + Gehirn-Modell. Aber dieses Gehirn kann in Zukunft auch Einarmroboter, mobile Roboterarme, zweiachsige Radroboter und humanoide Roboter steuern.

"Ein Gehirn, eine Form" ist an sich der schwierigste Teil. Wenn man ein Gehirn trainieren kann, um einen Einarmroboter zu kontrollieren, sodass er weiß, wie er schweißen, Hindernisse vermeiden und die Position anpassen soll, dann sind bereits über 80% der universellen Fähigkeiten gelöst. Unsere Einschätzung ist, dass, sobald das "ein Gehirn, eine Form" Konzept in einem Anwendungsfall erfolgreich umgesetzt werden kann, die Schwierigkeit der Anpassung an verschiedene Roboterformen auf etwa 10% sinken wird.

Intelligent Emergence: Die Betonung von "ein Gehirn, viele Formen" lässt vermuten, dass Xiaoyu Zhizao hauptsächlich an der Entwicklung von Gehirn-Modellen arbeitet. Wie lautet also die genaue Positionierung der Firma?

Qiao Zhongliang: Obwohl wir unseren Kunden derzeit eine integrierte Hard- und Softwarelösung anbieten, liegt unser Fokus bei der Forschung und Entwicklung tatsächlich auf der Gehirn-Entwicklung. Man kann dies auch an der Personalstruktur erkennen: Zwei Drittel unserer Ingenieure arbeiten an Modellalgorithmen, also hauptsächlich an der Gehirn-Entwicklung.

Intelligent Emergence: Die Geschäftsidee von Xiaoyu Zhizao scheint wie eine Geschichte von "Eierlegende Wollmilchsau" zu sein, die schließlich zu einer universellen Lösung führt?

Qiao Zhongliang: Genauer gesagt ist unser Ausdehnungspfad eher wie ein "Fächer". Wir beginnen mit der Schweißanwendung und erweitern uns dann allmählich wie ein aufgeklapptes Fächer, mit immer mehr Anwendungsfällen und immer stärkerer Rechenleistung.

Ich möchte nicht ein sehr komplexes Modell entwickeln, das aber keine praktische Anwendung findet. Einerseits würde dadurch kein geschlossener Datenkreislauf entstehen, andererseits gäbe es keinen Cashflow, um das Projekt zu unterstützen. Dieser Ansatz, zunächst an einem Punkt einzusteigen und dann allmählich auszuweiten, führt schließlich zur Entwicklung einer universellen Embodied AI-Firma.

Intelligent Emergence: Sie haben gesagt, dass Schweißen in der "Fächererweiterung" wie ein "Stützpunkt" ist. Wie kann man von einem so spezifischen Anwendungsfall wie Schweißen in eine universellere Zukunftsmärkte gelangen?

Qiao Zhongliang: Wir beginnen mit der Schweißanwendung als "Stützpunkt" und erweitern uns dann allmählich wie ein Fächer.

Beispielsweise kann man nach erfolgreicher Umsetzung der Schweißanwendung in angrenzende Bereiche wie das Nieten (vorherige Stufe) und das Schleifen (nachfolgende Stufe) expandieren und dann auch in andere Bereiche wie Lackieren vordringen. Indem man die Schweißanwendung vollständig umsetzt und beweist, dass man diesen Weg gehen kann, kann man dann seine Fähigkeiten auf andere Anwendungsfälle übertragen.

Intelligent Emergence: Müssen alle Anwendungsfälle im Fächer selbst von Xiaoyu Zhizao bearbeitet werden? Wird es ähnlich wie bei der Gründung vieler Geschäftseinheiten (Business Units) organisiert?

Qiao Zhongliang: Wir werden nicht 100 Business Units gründen, um alle Aufgaben selbst zu übernehmen. Wir planen, ein Branchen-Ökosystem aufzubauen und mehr Lösungsprovider zu fördern, die zusammenarbeiten. Sie können unsere Lieferketten, Vertriebskanäle und Marke nutzen, und wir unterstützen sie mit Kapital, um gemeinsam eine Datenplattform und Basis-Modell aufzubauen.

Intelligent Emergence: Xiaoyu Zhizao hat derzeit mehrere Industriearbeitgeber als Investoren. Welche Ressourcen können sie für die Umsetzung der Anwendungsfälle bringen?

Qiao Zhongliang: Sie können eine starke Synergie in den Anwendungsfällen bieten. Beispielsweise hat die China Merchants Group zahlreiche Schiffswerften und Infrastrukturprojekte in der Schwerindustrie. Mit einem Jahresumsatz von über 100 Milliarden Yuan und ihrer Investition in unser Unternehmen werden wir natürlich vorrangig in ihren Anwendungsfällen unsere Technologien testen und implementieren. Ebenso hat Xiaomi eine enorme Anzahl von Anwendungsfällen in der Automobilindustrie, der Großgeräteindustrie und der 3C-Branche.

△ Qiao Zhongliang (Mitte) besichtigt industrielle Anwendungsfälle, Foto: Interviewer 

Das Gehirn in industriellen Anwendungsfällen trainieren

Intelligent Emergence: Muss man selbst Schweißen lernen, um ein Schweißroboter mit Embodied AI zu entwickeln, das den Kundenanforderungen entspricht?

Qiao Zhongliang: Ja, man muss vor Ort sein und beobachten, wie die Benutzer die Arbeit ausführen und wo die Probleme liegen.

Man muss sogar in die Sprache der Kunden eintauchen. Beispielsweise wird von Schweißarbeitern oft der Begriff "Zündrate" verwendet, der sich auf die Anzahl der Stunden, in denen die Schweißpistole brennt, im Verhältnis zur Arbeitszeit des Schweißers bezieht. In der Schweißindustrie ist dies ein ähnlicher Indikator wie der Return on Investment (ROI) und misst die Effizienz der Schweißarbeiten.

Indem man vor Ort ist, kann man besser verstehen, wie wichtig die "Zündrate" ist. Unser nächstes Ziel wird es sein, die "Zündrate" des Roboters zu verbessern.

Intelligent Emergence: Obwohl Roboter nicht müde werden wie Menschen und die Zündrate sicherzustellen können, kann der Schweißqualität eines Roboters mit Embodied AI-Modell in der gleichen Zeit die Qualität eines menschlichen Schweißers erreichen?